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Vorwort. 



Wenn ich, einem Wunsche der Verlagsbuchhandlung ent- 
sprechend, einen erneuten Abdruck der vorliegenden Schrift, 
die zuerst im Jahre 1868 als Inauguraldissertation zur Er- 
langung der Doktorwürde der Leipziger philosophischen Fakultät 
vorgelegt wurde, und die bisher im Buchhandel nicht erhält- 
lich war, der OfiFentlichkeit übergebe, so bin ich mir sehr 
wohl bewusst, dass die an ausgezeichneten Werken ohnehin 
reiche Litteratur über die Methode der kleinsten Quadrate 
durch die bescheidene Arbeit nicht erheblich bereichert wird. 
Indessen ist sie doch im Laufe der Zeit einer gewissen Be- 
achtung, auch seitens namhafter; Autoren, nicht unwert ge- 
funden worden. Dieser Umstand erklärt die mehrfachen Nach- 
fragen nach ihr bei der Verlagsbuchhandlung, in deren Druckerei 
sie zuerst hergestellt wurde, und beim Verfasser. 

Für manche mag es nicht unwillkommen gewesen sein, 
dass die kleine Schrift eine historisch -kritische Darstellung 
der hauptsächlichsten Begründungsweisen der für die Praxis 
so wichtig gewordenen Methode enthält. Femer hat einen 
gewissen Anklang gefunden der Versuch, diese Methode mit 
Verzicht auf Wahrscheinlichkeitsbetrachtungen als ein allge- 
meines Prinzip zu begründen, das zur Lösung aller Aufgaben 
des „möglichst nahe Liegens" dienen kann. Und endlich ist 
sogar die schüchtern ausgesprochene Meinung von der Möglich- 
keit, dass diese Probleme eine ganz allgemeine Bedeutung für 
die Auffassung von Naturvorgängen haben könnten, nicht un- 
beachtet geblieben. 

Kam ich nun zu dem Entschlüsse, die anspruchslose 
Schrift nach so langer Zeit nochmals herauszugeben, so musste 
mir ihr unveränderter Abdruck als der einzig zulässige Weg 
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zur Öffentlichkeit erscheinen. Denn hätte ich nach 26 Jahren 
an die Erstlingsarbeit die bessernde Hand anlegen wollen, so 
wäre von ihrer ursprünglichen Gestalt sicher nicht mehr viel 
übrig geblieben und doch gerade in dieser Gestalt hatte sie 
sich einige Gönner erworben. Es ist daher der Abdruck mit 
ganz unwesentlichen Abweichungen in Ausserlichkeiten nur 
mit einer notwendig gewordenen Abänderung eines Passus auf 
S. 45, der nach so langer Zeit sich wunderlich ausgenommen 
hätte, unverändert erfolgt. 

Indessen habe ich mir nicht versagen können, dem un- 
veränderten Abdruck zwei neue Zusätze anzufügen. In dem 
ersten habe ich die Stellrmg der Methode der kleinsten 
Quadrate zur Wahrscheinlichkeitstheorie und namentlich zum 
Gauss sehen Fehlergesetz nochmals kritisch erörtert, wobei 
ich mich auf gewichtige Meinungen Anderer stützen konnte. 
Es musste sich dadurch die Ansicht bestätigen, dass man die 
Begründung der Methode am besten ganz unabhängig von 
einer auf Wahrscheinlichkeitsprinzipien fussenden Fehlertheorie 
unternehmen könnte. Der zweite Zusatz enthält einige litterarische 
Notizen, aus denen zu ersehen ist, dass eine Darstellung von 
einigen nach Abfassung dieser Schrift gegebenen Begründungen 
der Methode und Beurteilungen ihrer Resultate nicht zu Un- 
gunsten des von dem Verfasser eingehaltenen Standpunktes 
spricht. 

Dresden, Juli 1894 

R. Henke. 
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Henke, Methode der kleinsten Quadrate. 2. Aufl. 



Die Methode der kleinsten Quadrate steht in den mathe- 
matischen Wissenschaften auf der Grenze zwischen Theorie 
und Praxis imd hat den Zweck, zwischen beiden zu ver- 
mittebi. Auf der einen Seite ist sie ein unentbehrliches Hilfs- 
mittel, um die Erfahrungsresultate mit der strengen Theorie 
in Übereinstimmung zu bringen; auf der anderen macht sie 
es möglich, auch die Resultate der praktischen Forschung, 
welche Grössen liefert, die nicht streng bestinmit sind, son- 
dern innerhalb gewisser Grenzen schwanken, zu benutzen, 
Tim theoretische Folgerungen aus ihnen abzuleiten. Die grosse 
Wichtigkeit dieser Methode hat man auch wohl erkannt und 
sie mehrfach zum Gegenstand eingehender Untersuchungen 
gemacht, indem man sich entweder angelegen sein liess, sie 
hinsichtlich ihrer praktischen Anwendung weiter auszubauen 
oder ihre theoretischen Fundamente fester zu gründen. Es ist 
aber nicht zu verkennen, dass die ersteren Bestrebungen ihrem 
Ziele viel näher gekommen sind als die letzteren; denn während 
sich die Methode der kleinsten Quadrate einer so ausgezeich- 
neten praktischen Vervollkommnung erfreut, dass gegenwärtig 
ihre Benutzung ganz allgemein ist, hat man bis auf die neueste 
Zeit immer wieder für nötig erachtet, Untersuchungen über 
ihre Begründimg anzustellen. Auch heute gehen die Mein- 
ungen über die Stellung und Bedeutung der Methode der 
kleinsten Quadrate noch sehr auseinander, und trotz der vielen 
und zum Teil klassischen Arbeiten, die darüber veröfiFentlicht 
worden sind, kann die Streitfrage bis jetzt nicht als endgiltig 
entschieden betrachtet werden. Vielleicht wird man überhaupt 
keine Hofl&iung haben, auf den bisher eingeschlagenen Wegen 
zu einer Beilegung des Streites zu gelangen — dann dürfte 
es nicht ganz überflüssig sein, auf einen noch nicht benutzten 
Ausgangspunkt für diese Untersuchungen hinzuweisen. 

Bevor ich jedoch hierzu schreite, wird es zunächst meine 
Aufgabe sein, die hauptsächlichsten bisherigen Betrachtungs- 
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weisen und Darstellungen der Begründung dieser Methode 
zusammenzustellen, näher zu beleuchten und zu vergleichen. 
Bei der so überaus grossen Reichhaltigkeit der hier ein- 
schlagenden Litteratur kann ich freilich nicht hoffen, etwas 
Vollständiges zu bieten; ich liess es mir nur angelegen sein, 
alle diejenigen Abhandlungen und Schriften selbst nachzusehen, 
in denen etwas Neues für die Auffassung des Gegenstandes 
zu vermuten war» 
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Darstellung nnd Kritik der verschiedenen 
Begrftndnngsweisen der Methode der kleinsten 

ünadrate. 



1. Wenn es sich darum handelt, von der Berechtigung 
eines so wichtigen und allgemein angewandten Rechnungs- 
verfahrens, wie es . die Methode der kleinsten Quadrate dar- 
bietet, demjenigen zuerst eine klare Überzeugung zu geben, 
der sich desselben praktisch bedienen will, so ist ohne Zweifel 
die erste Begründung der Methode, die ihr Erfinder Gauss 
gegeben hat^), noch heute als die vorzüglichste zu betrachten 
Sie zeichnet sich durch die grösste Einfachheit, Schärfe und 
Eleganz aus, und man findet sie daher in den meisten Lehr- 
büchern über diesen Gegenstand, die ein mehr praktisches Ziel 
verfolgen, adoptiert. Gauss erhält aus der Voraussetzung, dass 
bei einer einzigen, durch direkte Beobachtungen zu bestimmenden 
Grösse das arithmetische Mittel aus den Beobachtungswerten 
der wahrscheinlichste Wert dieser Grösse sei, den Satz, dass 
im aQgemeinen als die wahrscheinlichsten Werte für ein in 
bestimmtem Zusammenhange stehendes System von Grössen 
diejenigen anzunehmen seien, welche die Summe der Quadrate 
der übrigbleibenden Fehler zu einem Minimum machen. Über 



1) Gauss, Theoria motus corporum coel^tium, Hamburg 1809. — 
Sectio m. 
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die Bedeutung dieses Fundamentaltheorems sagt er^): j^Hocce 
principium, quod in omnibus applicationibus mathesis ad philoso- 
phiam naturalem usum freqtientissimum offert, vhique axiomatis 
loco eodem iure välere dehet, quo medium arifhmeticum inter 
plures valores öb^eruatos emsdem quantitatis iamquam valor 
maxime pröbabilis adoptatur.^^ — Dieser grosse Mathematiker 
schlug den einfachsten und naturgemässesten Weg ein, indem 
er einen Satz, der längst als Prinzip anerkannt war und der 
dem praktischen Gefühl als das einzig mö^che Auskunfts- 
mittel erscheint, zu verallgemeinern suchte und dadurch eine 
für das praktische Interesse völlig genügende Herleitung der 
Methode der kleinsten Quadrate gab. Wenn man aber auf 
den Satz vom arithmetischen Mittel zurückgeht, der dieser 
Herleitung als Prinzip zum Grunde liegt, so sieht man ein^ 
dass derselbe eine vöUig willkürliche Annahme enthält, dass 
also auch dem daraus mathematisch streng gewonnenen Fun- 
damentalsatze Willkür beiwohne, und es entsteht nur die 
Frage, ob eine solche Willkür notwendig übrig bleibe oder 
ob dieselbe weggeschafft oder beschränkt werden könne. 
Gauss selbst erkennt, dass diese Willkürlichkeit in der Natur 
des Problems begründet liege, zu dessen Lösung die Methode 
der kleinsten Quadrate eben dienen solle. Die Aufgabe sei 
nämlich so gestellt: möglichste Übereinstimmung zwischen den 
Beobachtungsresultaten herbeizuführen. ,^Haec vero notio natura 
sua aliquid vagi inuoluit^^^), und es mache sich daher die will- 
kürliche Einführung irgend eines Prinzipes nötig. So könnte 
man auch ohne Wahrscheinlichkeitsrechnung zu einem ähn- 
lichen Fundamentalsatze gelangen und analog z. B. die Summe 
von irgend anderen, als den zweiten Potenzen der Fehler zu 
einem Minimum machen. Aber seine Methode zeichne sich 
vor allen anderen durch sehr wesentliche praktische Vorteile 
aus, so dass man ihr, wenn sie auch theoretisch keine grössere 
Berechtigung in Anspruch nehmen könne, doch im Hinblick 
auf den praktischen Zweck einer solchen Methode überhaupt^ 
unbedingt den Vorzug geben müsse. 

2. Was die nähere Auseinandersetzung dieser praktischen 
Vorteile betrifft, so verweist Gauss auf Legendre, der schon 



1) 1. c. § 179 pag. 218. 

2) 1. c. § 186 pag. 220. 
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drei Jahre vor ihin^) dieselbe Methode angewandt hatte. Die 
Priorität der Erfindung kommt trotzdem Gauss zu, da der- 
selbe^) die Methode schon 1795 in seinen Rechnungen benutzt 
hat. Legendre giebt diesem Verfahren in einem Appendice 
zu dem citierten Werke zuerst den Namen y,methode des 
moindres quarres^^, zeigt, wie man auf dasselbe geführt werde 
und bespricht seine Vorteile. Eine theoretische Begründung 
desselben giebt er nicht, sondern betrachtet die Sache rein 
empirisch. Er sieht ein, dass, wenn man aus Beobachtungen 
eine grössere Anzahl Gleichungen erhält, als zur Bestimmung 
der Unbekannten nötig sind, man über die Art der Verteilung 
der übrigbleibenden Fehler eine willkürliche Annahme machen 
müsse, und da empfehle sich die von ihm statuierte aus 
praktischen Gründen am meisten. Denn sie enthalte das in 
der Praxis lange übliche und bewährte Prinzip lies arith- 
metischen Mittels in sich; sie gebe die Auflösungen bestimmt 
und stelle zwischen den übrigbleibenden Fehlem ein an- 
gemessenes Gleichgewicht her. Vor allem aber erscheint ihm 
die Analogie mit den Eigenschaften des Schwerpunktes be- 
merkenswert: er zeigt, dass, wenn man einen Punkt im 
Baume durch Koordinaten zu bestimmen habe, die Beobacht- 
ungen aber mehrere verschiedene Punkte liefern, nach seiner 
lijethode dann als der richtige Punkt der Schwerpunkt aller 
dieser Punkte anzunehmen sei. Diese Analogie hält er für 
sehr fruchtbar für die Beurteilung seiner Methode überhaupt 
und sagt darüber^): „Ow voit donCj que la methode d£s 
moindres quarres fait connaitre, en quelque sorte, le centre 
autour duquel viennent se ranger tous les resultats fournis par 
Vexperiencey de maniere ä s^en ecarter le moins qv!il est 
possible}^ 

Durch diese beiden ersten Arbeiten, die sich gegenseitig 
ergänzen, wurde die Methode der kleinsten Quadrate ein- 
geführt und ihr eine feste Stellung angewiesen. Je mehr 
man aber ihr eigentümliches Wesen erkannte, desto eifriger 
war man bemüht, entweder die Untersuchungen von Gauss 



1) Legendre, Nouvelles metJwdes pour la determination des orhites 
des cometes, Paris 1806, 

2) Vergl. Theoria motus etc. pag. 22X, 

3) 1. c. pag. 75. . 
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weiter zu führen, oder auch selbständig von anderen Aus- 
gangspunkten dasselbe oder ein nahe liegendes Ziel zu er- 
reichen. 

3. Der Erste, der nach den Erfindern weitere Unter- 
suchungen über die Methode der kleinsten Quadrate anstellte, 
war Laplace^). Derselbe benutzte schon vor Gauss^ ein 
rationelles Verfahren zur Auflösung von Gleichungen, deren 
Anzahl grösser ist, als die der daraus zu bestimmenden Un- 
bekannten, nämlich das zuerst von Boscowich vorgeschla- 
gene, welches einfach darin bestand, dass man die Summe 
der Differenzen selbst, alle als positiv genommen, zu einem 
Minimum machte. Später gelangte er völlig selbständig auf 
einem indirekten Wege und durch tiefgehende theoretische 
Untersuchungen zu derselben Methode wie Gauss. 

Aus den überzähligen Bedingungsgleichungen, durch welche 
die zu bestimmenden Grössen mit den durch Beobachtung 
gefundenen verknüpft sind, müssen diejenigen Endgleich- 
ungen konstruiert werden, aus denen die wahrscheinlichsten 
Werte dieser Unbekannten zu finden sind. Dazu giebt Laplace 
folgendes Verfahren an. Man multipliziere die Bedingungs- 
gleichungen mit so vielen Systemen von Faktoren, als die 
Anzahl der Unbekannten beträgt, und addiere jedesmal die 
multiplizierten Gleichungen; dadurch erhält man eine zur Be- 
stimmung der Unbekannten notwendige und hinreichende An- 
zahl von Endgleichungen. Über die speziellen Werte dieser 
Faktoren hat man freie Verfügung; Laplace disponiert in 
der Weise darüber, dass der mittlere zu fürchtende Fehler 
zu einem Minimum gemacht wird, wobei er unter dem 
mittleren Fehler die Summe der Produkte sämtlicher 
Fehler ohne Rücksicht auf ihr Vorzeichen in ihre resp. Wahr- 
scheinlichkeiten versteht. Um nun aus dieser Bestimmung 
die Werte der Faktoren und damit die wahrscheinlichsten 
Werte der Unbekannten herleiten zu können, müsste in jedem 
speziellen Falle das Gesetz der Wahrscheinlichkeit der Fehler 
bekannt sein; die weiteren Untersuchungen von Laplace 
geben aber das merkwürdige Resultat, dass unter Voraus- 

1) Laplace, Uidorie analytique des probabüüis, Paris 1812. 
11^ ed. ibid. 1814, IIB M. ibid. 1820. 

2) Vergl. Theoria moius etc. pag. 221, 



der Methode der kleinsten Quadrate. 9 

Setzung einer sehr grossen Zahl von Beobachtungen immer 
diejenigen Systeme von Faktoren zu wählen sind, welche die 
Methode der kleinsten Quadrate erfordert — gleichviel nach 
welchem Gesetze sich die Wahrscheinlichkeiten der Fehler 
ändern. 

Auch bei dieser Betrachtungsweise kommt alles schliess- 
lich auf willkürliche Annahmen hinaus, und zwar liegt hier 
die Willkür in der Definition des mittleren Fehlers. Dessen 
ist sich auch Laplace völlig bewusst: er giebt zu, dass 
man, abgesehen von dieser, noch andere Arten der. Kom- 
bination der Bedingungsgleichungen finden und gebrauchen 
könne; aber um es zu rechtfertigen, dass er gerade dieser 
den Vorzug vor allen anderen gegeben, rekurriert auch er auf 
die praktischen Vorteile, die sie gewährt. Unter allen Arten, 
die Bedingungsgleichungen zu kombinieren, um lineare 
Endgleichungen zu erhalten, sei die, welche die Methode der 
kleinsten Quadrate enthalte, die vorteilhafteste, wenigstens 
wenn die Anzahl der Beobachtungen eine sehr beträchtliche 
ist. Denn gerade für diesen Fall hörten dann, wenn man 
statt der Summe der Quadrate etwa die Summe irgend anderer 
Potenzen oder sonst eine Funktion der Fehler zu einem 
Minimum machen wollte, die Endgleichungen auf, linear und 
daher praktikabel zu sein. — Die Betonung des Umstandes, 
dass die Methode der kleinsten Quadrate bei linearen Be- 
dingungsgleichungen auch auf lineare Endgleichungen führt, 
erscheint übrigens besonders bemerkenswert; später hat diese 
g^nz wesentliche Eigenschaft der Methode der kleinsten Qua- 
drate nicht allenthalben eine ihrer Wichtigkeit entsprechende 
Berücksichtigung gefunden. 

Die Begründung der Methode der kleinsten Quadrate, 
welche Laplace gegeben, ist wegen der Feinheit seiner 
Analyse von hohem theoretischem Interesse; sie bietet aber 
viel weniger wichtige Beziehungen zur Praxis, als die Gauss- 
sche, von der sie sich schon durch den überaus grossen 
Apparat von Rechnung unterscheidet. Jedoch auch seine 
Annahmen und Voraussetzungen stehen an Einfachheit und 
Plausibilität hinter dem Gaussschen einzigen Prinzip des 
arithmetischen Mittels wesentlich zurück. Gegen die will- 
kürliche Annahme über das Minimum des mittleren Fehlers 
nach seiner Definition lässt sich allerdings nichts einwenden. 



10 !• Darstellung und Kritik der verschiedenen Begründungsweisen 

da die Lösung der Aufgabe eine gewisse Willkür erheischt; 
was aber die Voraussetzung einer sehr grossen Zahl von 
Beobachtungen anlangt, so ist dieselbe nur in den wenigsten 
der praktisch vorliegenden Fälle erfüllt; abgesehen davon, 
dass immer die Unsicherheit übrigbleibt, von wo an man 
die Anzahl als „sehr gross" betrachten könne, da die Ab- 
leitung streng genommen nur für eine unendlich grosse 
Anzahl gilt. 

4. Gauss selbst hat über die Methode der kleinsten 
Quadrate später noch zwei Abhandlungen "^^ veröffentlicht, in 
welchen er den Gegenstand von möglichst allgemeinen Gesichts- 
punkten betrachtet und zugleich über die Laplacesche Be- 
gründungsweise kritische Bemerkungen macht. Er lässt hier 
zuerst die Funktion» cpx für die relative Leichtigkeit, einen 
Fehler von der Grösse x zu machen, ganz unbestimmt und 
betrachtet die drei Litegrale 

f(px dx, Jx (px dXy fx^ (px dx. 

Das erste Litegral, genommen zwischen den Grenzen a und 6, 
drückt die Wahrscheinlichkeit aus, dass der Fehler enthalten 
sei zwischen diesen Grenzen; das zweite von — oo bis H- oo 
ausgedehnt, giebt den mittleren Wert sämtlicher Fehler, 
und dieser muss, unter der Voraussetzung, dass positive und 
negative Fehler von derselben absoluten Grösse gleich wahr- 
scheinlich sind, gleich Null sein, wenn die Beobachtungs- 
resultate konstante Fehler nicht mehr enthalten. Der Wert 
des dritten Integrals endlich, genommen zwischen denselben 
Grenzen, scheint ihm am passendsten zur Beurteilung der 
den Beobachtungen anhaftenden Unsicherheit, so zwar, dass 
dasjenige System von Fehlern, für welches dieses Litegral 
den kleinsten Wert erhält, als das wahrscheinlichste anzu- 
sehen ist. Bei der in der Praxis vorkommenden Aufgabe 
sind also die Bedingungsgleichungen so zu kombinieren, dass 
dieser Wert möglichst klein wird. Stellt man im allgemeinen 
den Wert dieses Integrals unter der Form m^ dar, so nennt 
Gauss m den mittleren zu fürchtenden Fehler. Dass 



1) Gauss, Theoria combinationis ohservationum errorum minimis 
ohnqxiae, Comment. Soc. Beg. Scient. Gotting. Bec. Vol. V, 1819— 1822 ; 
und Supplementum iheoriae combinationis etc, Gotting. 1828, 
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hierin die einmal unumgängliche Willkür liegt, spricht er 
selbst ganz scharf so aus: y,Quodsi quis hanc rationem pro 
arbitriOy nulla cogente necessitate, electam esse obiiciat, lubenter 
assentiemur. Qtiippe qmestio haec per rei naturam aliquid vagi 
implicat, qtu>d limitihtcs circumscrihi nisi per prindpium aliqua- 
tenus arbitrium nequit.^^ 

Nun führt Gauss den schon von Laplace gegebenen 
Vergleich der Beobachtungen mit einem Spiele an, in welchem 
man nur verlieren, nie gewinnen kann. Es handelt sich da- 
bei nur um die entsprechende Schätzung der Verluste. Ohne 
weiteres erhellt, dass man diese Verluste nicht den Fehlem 
selbst gleich setzen kann, denn dann würden positive und 
negative Fehlergrössen Gewinn und Verlust repräsentieren; 
vielmehr müssen die Verluste durch eine stets positive Funk- 
tion der Fehler dargestellt werden. Die Bestimmung dieser 
Funktion muss einer willkürlichen Annahme überlassen blei- 
ben, wobei freilich die einfachste als die beste zu betrachten 
ist. Wenn Laplace die Verluste abschätzt nach den abso- 
luten Werten der Fehler, so macht er damit nur eine will- 
kürliche Annahme über jene immer positiv bleibende Funk- 
tion, und hat dazu nicht weniger und nicht mehr Recht, als 
wenn Gauss die Verluste nach den Quadraten der Fehler 
beurteilt. Gauss zeigt jedoch weiter, dass, wenn man den 
Begriff des mittleren Fehlers auf seine Weise und nicht nach 
der Definition von Laplace fasst, man grössere praktische 
Vorteile für sich habe, und dass, wenn man für die un- 
bestimmt gelassene Funktion 9? den Ausdruck e— '**** nimmt 
— worüber er auf seine erste Darstellung in der Theoria motus 
etc. verweist — sich die Methode der kleinsten Quadrate mit 
völliger Strenge für jede Anzahl von Beobachtungen ergebe; 
ja auch bei anderen Voraussetzungen über das Wahrscheinlich- 
keitsgesetz sei sein Prinzip „erc omnibus Optimum ^ non quidem 
proximey sed absolute^^. 

Auch durch diese Arbeiten von Gauss wurde die Be- 
deutung der Methode der kleinsten Quadrate nicht verändert: 
sie blieb ein notwendiges Hilfsmittel, das sich auf einfache 
und plausible Voraussetzungen stützte und gewichtige prak- 
tische Vorteile bot. Eben diese Voraussetzungen jedoch 
bedürfen einer weiteren Prüfung; denn es fragt sich, ob 
dieselben wirklich die einfachsten sind, welche gemacht wer- 
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den können, oder ob sie nicht vielleicht bei näherer Be- 
trachtung sich als Folgerungen aus noch einfacheren, noch 
mehr plausibehi Prinzipien erweisen, die ihrerseits, wenn sie 
auch nicht als mathematische Axiome gelten können, doch 
so beschaffen sind, dass sich durchaus nichts anderes an ihre 
Stelle setzen lässt und die einen für eine theoretische Unter- 
suchung misslichen Hinweis auf grössere oder geringere prak- 
tische Vorzüge der einen oder anderen Annahme überflüssig 
machen. 

5. Diese in der bisherigen Begründung der Methode der 
kleinsten Quadrate noch übrigbleibende Lücke bemerkte 
Encke^), und bestrebte sich, dieselbe auszufüllen. Er kri- 
tisiert die verschiedenen Arten des Beweises der Notwendig- 
keit dieser Methode, die von Legendre, Gauss imd La- 
place gegeben worden waren, und betrachtet als die ein- 
fachste Voraussetzung, die man zu ihrer Ableitung benutzen 
könne, diejenige des arithmetischen Mittels als des wahrschein- 
lichsten Wertes bei einfachen Beobachtungen. Aber man 
dürfe sich nicht damit begnügen, diesem Satze als einem durch 
die Erfahrung hinlänglich bestätigten und sanktionierten ohne 
weiteres axiomatische Geltung beizumessen, sondern müsse 
denselben auf noch einfachere Prinzipien zurückführen, so 
dass, wenn man aus diesen den Satz vom arithmetischen 
Mittel abgeleitet habe, die von Gauss gegebene Herleitung 
der Methode der kleinsten Quadrate dann als ein völlig 
strenger Beweis derselben gelten müsse. In späteren Ab- 
. handlungen^) giebt er eine ausführliche Darlegung, wie man 
zu einem solchen Prinzipe vordringen könne und findet es in 
der Voraussetzung, dass positive und negative Abweichungen 
von gleicher absoluter Grösse auch als gleiche Fehler an- 
gesehen werden sollen. „Diese Voraussetzimg scheint, wenn 
überhaupt ein Grundsatz nötig ist, unter allen die einfachste 
zu sein. Sie beruht auf dem Bewusstsein, die möglichste 
Sorgfalt angewandt zu haben, so dass kein Grund vorhanden 
ist, anzunehmen, man habe entweder im positiven oder im 



1) Encke, Über die Begründung der Methode der kleinsten Qua- 
drate. Abhandlungen der Berliner Akademie vom Jahre 1831. 

2) Encke, Über die Methode der kleinsten Quadrate. Berliner 
astronomisches Jahrbuch von 1834, 1835, 1836. 
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negativen Sinne gefehlt." Hat man daher für eine Grösse x 
zwei Beobachtungswerte a und fc, so wird man diesem Grund- 
satze gemäss x nicht anders wählen können^ als sO; dass die 
Abweichungen x—a und x—h absolut genommen gleich, aber 
von entgegengesetzten Vorzeichen sind, folglich muss man 
a;«-|- (a+6), d. h. gleich dem arithmetischen Mittel aus den 
beiden Beobachtungswerten annehmen. Man sieht hieraus, 
dass das von Encke aufgestellte Prinzip darauf hinauskommt, 
die Geltung des arithmetischen Mittels nicht allgemein, sondern 
nur für zwei Beobachtungswerte als willkürliche Annahme 
zu statuieren. Unleugbar ist in dieser Fassung das Prinzip 
höchst einfach und plausibel, aber es kann nicht, ohne noch 
andere Annahmen, dazu dienen, den Satz vom arithmetischen 
Mittel für beliebig viele Beobachtungswerte streng herzuleiten. 
Wenn dies Encke trotzdem versucht, so begeht er eine 
Unrichtigkeit in der Schlussweise, wie Reuschle nach- 
gewiesen^), dessen Einwände auch durch die Encke sehe 
Replik») nicht völHg entkräftet worden sind. Denn Enckes 
Betrachtung kann nur zu dem Resultate führen, „dass der 
wahrscheinlichste Wert einer Grösse aus n beobachteten 
Werten derselben eine lineare symmetrische Funktion dieser 
Werte und zwar von der Art sein müsse, dass sie, im Fall 
jene n Beobachtungswerte einander gleich wären, auf diesen 
dann einzig möglichen Wert sich reduzieren würde." So 
könnte man demnach bei deii n Beobachtungswerten a, &, c... 
ebenso wie 



auch 

X 



X ^ — (a + b + c + , . .), 



1/ — (a'^-f &"' + c"» + ...) 



als den wahrscheinlichsten Wert annehmen. Freilich ist das 
arithmetische Mittel von allen diesen Funktionen die ein- 
fachste und praktisch vorteilhafteste; wenn man aber, um 
die Geltung desselben allgemein zu erweisen, noch anderer 

1) Reuschle, Über die Deduktion der Methode der kleinsten 
Quadrate aus Begriffen der Wahrscheinlichkeitsrechnung. Grelles 
Journal, 26. Bd. 1843. 

2) Grelles Journal, 28. Bd. 1844. S. 213. 
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Voraussetzungen oder der Hinweisung auf praktische Vorzüge 
bedarf, so ist die Sache durch das Prinzip von Encke um 
nichts gebessert.^) 

6. Mit diesem einen Versuche, das arithmetische Mittel 
«,1s Folgerung aus noch einfacheren Prinzipien hinzustellen, 
hatte es für die Zukunft sein Bewenden; man suchte nun von 
anderer Seite her zu einer Begründung der Methode der 
kleinsten Quadrate zu gelangen. Gauss hatte aus der An- 
nahme des arithmetischen Mittels zuerst den Ausdruck C7c~~*'** 
für die Wahrscheinlichkeit, einen Fehler x zu begehen, her- 
geleitet, und hieraus ergab sich der Satz vom Minimum der 
Fehlerquadrate. Den indirekten Weg durch das arithmetische 
Mittel hindurch musste er einschlagen, um zu jenem Aus- 
drucke zu kommen, weil über die Natur der Fehler selbst 
Tind die sich daraus ergebende Wahrscheinlichkeit sie zu 
begehen, a priori nichts bekannt ist. Wenn es aber 
möglich wäre, diese innere Natur der Fehler zu er- 
forschen, oder wenigstens eine plausible Hypothese darüber 
aufzustellen, so könnte man direkt zu einem Ausdruck für 
die Wahrscheinlichkeit der Fehler gelangen, und wenn 
dieser mit dem Gauss sehen übereinstimmte, so wäre damit 
die Methode der kleinsten Quadrate in befriedigenderer Weise 
erwiesen. 

Den ersten Schritt zu diesem Ziele hin that Hagen.*) 
Er geht von der Hypothese aus, dass sich jeder (un- 
vermeidliche) Beobachtungsfehler aus einer sehr grossen 
Anzahl sehr kleiner, teils positiver, teils negativer, ihrem 
absoluten Werte nach nahe gleicher Elementar fehler 
zusammensetzt. Durch alle möglichen Arten der Kom- 
bination dieser Elementarfehler entstehen alle möglichen 
Fehler, und nach Regeln der Wahrscheinlichkeitsrechnung 
findet Hagen hieraus für die Wahrscheinlichkeit y, einen 
Fehler von der absoluten Grösse x zu begehen, den Aus- 
druck: 



1) Eine Reproduktion der Encke sehen Darstellung findet man 
in dem „Lehrbuch der höheren Geodäsie" von Fischer, Darmstadt 1845. 

2) Hagen, Grundzüge der Wahrscheinlichkeitsrechnung, Berlin 1837. 
2. Aufl. 1867. 
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worin 2w die Anzahl der Elementarfehler, 'tf die Wahrschein- 
lichkeit, den Fehler zu machen, bezeichnet. 

Diese Hypothese — man könnte sie vielleicht eine Mole- 
kulartheorie der Fehler nennen — die auf den ersten Blick 
ganz plausibel erscheint und durch die Übereinstimmimg des 
aus ihr sich ergebenden Resultates mit dem von Gauss über- 
rascht, ist bei näherer Betrachtung doch sehr bedenklich. 
Denn wenn man auch zugeben kann, dass ein Beobachtungs- 
fehler aus dem Zusammenwirken mehrerer Ursachen entstehe, 
so berechtigen uns doch weder die Erfahrung noch etwa 
theoretische Forschungen, die Zahl dieser Ursachen als eine 
sehr grosse und jede derselben von gleichem, sehr kleinem 
Einflüsse anzunehmen. Noch weit untriftiger ist die Voraus- 
setzung, dass alle diese Fehlerursachen ganz unabhängig von 
einander und so zufällig sich an dem Resultat, nämlich an 
der Hervorbringung eines Fehlers von bestimmter Grösse, 
beteiligen sollen, dass man in der Hagenschen Weise die 
Wahrscheinlichkeitsrechnung anlegen könnte. Andererseits 
könnte man allerdings schliessen, dass die Gleichheit des aus 
dieser Hypothese hergeleiteten Ausdruckes für die Wahr- 
scheinlichkeit der Fehler mit dem von Gauss gefundenen, 
eine solche atomistische Theorie annehmbar mache, und man 
somit, wenn die Geltung jener Transszendente von anderer 
Seite her gesichert sei, einen wichtigen Aufschluss über die 
innere Natur der Fehler erhalten habe. Allein bei diesem 
Schlüsse hat man mit grosser Vorsicht zu verfahren; denn 
einmal gilt die Hagensche Ableitung streng nur für unend- 
lich viele unendlich kleine Elementarfehler von gleicher ab- 
soluter Grösse; die gegebene Formel liefert also nur einen 
Näherungswert und es könnte wohl sein, dass man in speziellen 
Fällen genötigt wäre, dieselbe etwas zu verändern, um sie den 
thatsächlichen Verhältnissen besser anzupassen. Sodann kann 
auch die Übereinstimmung nur eine rein zufällige sein; denn 
nach der in Rede stehenden Hypothese sind die Wahrschein- 
lichkeiten der aus bestimmten Kombinationen der 2w Elementar- 
fehler hervorgegangenen Fehler proportional den Binomial- 
koeffizienten des Binoms mit dem Exponenten 2«, und die 
mehrfach erwähnte Transszendent« ist nichts anderes, als die 



16 I. Darstellung und Kritik der verschiedenen Begründungsweisen 

asymptotische Funktion, welcher sich das Verhältnis eines 
Binomialkoeffizienten zn dem mittelsten nähert^); einer solchen 
Exponentialgrösse nähern sich aber sehr vielgestaltige Funktions- 
formen als Grenzfunktion, und man ist nicht berechtigt, von 
dieser zurückzuschliessen. Es braucht daher kein notwendiger 
Zusammenhang zwischen der aus dem Satz vom arithmetischen 
Mittel hergeleiteten Exponentialgrösse und der sich aus der 
Hagen sehen Hypothese ergebenden stattzufinden. 

7. Die Hagensche Hypothese und die sich darauf grün^ 
dende Ableitung der Methode der kleinsten Quadrate fand 
trotz der hier ausgesprochenen Schwächen eine günstige Auf- 
nahme, namentlich bei den Praktikern^). Man liess sich durch 
die Übereinstimmung seines Resultates mit der allgemein an- 
genommenen Funktionsform der Wahrscheinlichkeit der Fehler- 
grössen bestechen und hoffte, einen Blick in die innere Kon- 
stitution der Beobachtungsfehler thun zu können, über die es 
bis jetzt sogar an einer gegründeten Hypothese gefehlt hatte, 
und sich von dem Mechanismus, nach dem dieselben entstehen^ | 
eine Vorstellung zu machen. So fasst Encke die Sache ^). 
Er zeigt zuerst, wie man schon aus einer wenig bekannten 
Arbeit von Lagrange^) die Grundlagen für eine den übrigen. 
Anwendungen der Wahrscheinlichkeitsrechnung konforme An- , 
Wendung derselben auf die Theorie der Fehler entnehmen 
könne. Wenn man nämlich gewöhnlich das Eintreffen eines 
gewissen Ereignisses zu vergleichen pflege mit dem Eintreffen 

i 

1) Mit Hilfe der bekannten Näherungsformebi für die Binomial- 
koeffizienten mit grossem Exponenten findet man leicht, dass i 

Ltm H^-T — = e n . ! 

«=00 (2w)n 

2) Reproduktionen der Ha gen sehen Ableitung findet man z. B. 
in Nayiers Lehrbuch der Differential- und Integralrechnung. Deutsch 
herausgegeben und mit einer Abhandlung über die Methode der klein- ' 
fiten Quadrate begleitet von Witt st ein. 2. Bd. Hannover 1849. Liagre, 
Cälcul des prohabüües et theorie des erreurs avec des applications etc^ 
BmxeXks S.a. (Vorrede v. 1852). 

3) Encke, Über die Anwendung der Wahrscheinlichkeitsrechnung^ 
auf Beobachtungen. Astron. Jahrbuch für 1853. 

4) Lagrange, Memoire sur VutÜite de la methode de prendre Ze 
müieu entre les resuUats des plusiey^rs ohservations etc. MisceU. Tatmnensiiz 
Tom. V, pag. 167. • 
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eines gewissen Wurfes und zwar mit Würfeln, die man sich 
allgemein als Prismen mit beliebig vielen, entsprechend 
bezeichneten Seitenflächen denken kann, so könne man sich 
auch die verschiedenen Fehlerquellen repräsentiert denken durch 
solche Würfel, deren Flächen diejenigen Fehlergrössen, die 
jede Fehlerquelle für sich allein hervorzubringen vermag, als 
Bezeichnung tragen. Nun kenne man allerdings die Anzahl 
dieser Würfel und die Bezeichnung ihrer Seitenflächen nicht, 
aber es sei von Interesse nachzusehen, ob nicht unter den 
verschiedenen Arten des Würfelspiels eine sich finde, bei der 
man für die Wahrscheinlichkeit eines gewissen Wurfes dasselbe 
Gesetz erhielte, welches man allgemein für die Wahrscheinlich- 
keit eines Fehlers von bestimmter Grösse annehme. Ein solches 
Würfelspiel sei in der That gefunden durch die von Hagen auf- 
gestellte Hypothese, und Encke leitet aus derselben dieses Gesetz 
mit einer in der ursprünglichen Darstellung noch mangelnden 
Schärfe und Eleganz ab. Von der Hypothese selbst glaubt 
er, dass sie, wenn auch nicht zum Beweise, so doch zur Ver- 
anschaulichung des Mechanismus zu dienen geeignet sei, nach 
welchem bei Beobachtungen die Fehler von verschiedener Grösse 
entstehen. „Sie lässt gewissermassen ahnden, wie auch bei 
den Fehlem der Beobachtungen eine grosse Anzahl von 
Elementen, bei denen wir absolute Ruhe voraussetzen, durch 
ihre Schwingungen, wie sie überall in der Natur sich finden, die 
grösseren und kleineren Fehler bewirken könne." 

8. Eine ähnliche Betrachtungsweise wie die von Hagen 
hat Bessel gegeben^). Er zeigt, dass die Voraussetzungen 
über die Wahrscheinlichkeit der Fehler, wie sie das Gesetz 
der kleinsten Quadrate und also, nach der Ableitung von 
Gauss, auch das Prinzip des arithmetischen Mittels erfordere, 
durchaus nicht in allen praktisch vorliegenden Fällen als er- 
füllt anzunehmen sind, oder dass man sich wenigstens solche 
Fälle denken kann, in denen sie nicht zulässig sind. Er geht 
daher bei Aufstellung eines Ausdrucks für die Wahrschein- 
lichkeit der Fehler auf die Entstehungsweise derselben zurück 



1) Bessel, Untersuchungen über die Wahrscheinlichkeit der Be- 
obachtungsfehler. Schumachers astronom. Nachrichten, Bd. 15, S. 371, 
vom Jahre 1838. 

Henke, Methode der kleinsten Quadrate. 2. Anfl. 2 
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und nimmt an, jeder Fehler sei eine Folge mehrerer gleich- 
zeitig zusammenwirkender Ursachen. Unter dieser Voraus- 
setzung gelangt er schliesslich zu dem Resultate, „dass viele 
von einander unabhängige Fehlerursachen gleicher Ordnung 
durch ihr Zusammenwirken Fehler hervorbringen, deren Wahr- 
scheinlichkeit näherungsweise dieselbe ist, welche durch die 
Voraussetzung des arithmetischen Mittels, oder durch die Be- 
dingung der kleinsten Quadrate gefordert wird". Wo jedoch 
nachweislich eine oder mehrere die übrigen beträchtlich über- 
wiegende Fehlerursachen vorhanden sind, werden sich ab- 
weichende Resultate von den durch die Methode der kleinsteD 
Quadrate erhaltenen ergeben. 

Bessel will damit keine Ableitung der Methode der 
kleinsten Quadrate geliefert haben, sondern er beabsichtigt 
nur, die Bedingungen klar zu stellen, auf denen die Anwend- 
barkeit derselben in den einzelnen Fällen beruht, insoweit es 
sich nämlich darum handelt, durch diese Methode die wahr- 
scheinlichsten Werte für ein System von Unbekannten zu finden. 
Da wir aber über die innere Natur der Fehler im Dunkel 
schweben und die Wirkung der einzelnen Fehlerquellen für 
sich gar nicht zu beurteilen im stände sind, so möchte es 
schwer fallen zu entscheiden, ob in einem speziellen Falle 
jene Bedingungen erfüllt sind oder nicht. Es könnten vielleicht 
sogar derartige Ausnahmefälle öfter vorkommen als man denkt; 
indessen ist es wohl Thatsache, dass man sich ihretwegen in 
der Praxis über die allgemeine Anwendbarkeit der Methode 
der kleinsten Quadrate nicht viele Skrupel macht. Jedem 
sagt schon das praktische Gefühl, dass er im schlimmsten 
Falle, in dem er sich befindet, ohne es zu wissen — wo 
nämlich diese Methode nicht gerade den möglichst richtigen 
Wert giebt — doch auch durch dieselbe nicht ein Resultat 
erhalte, welches fehlerhafter wäre, als die fehlerhaftesten Be- 
obachtungswerte selbst, vielmehr dass sie, wie in einfacheren 
Fällen das arithmetische Mittel, ebenfalls mittlere Werte 
giebt. Hier wird man auf den Gedanken geführt, ob nicht 
den Resultaten der Methode der kleinsten Quadrate auch dann, 
wenn dieselbe nicht die wahrscheinlichsten Werte liefert, den- 
noch ein praktisch zu verwertender Sinn untergelegt werden 
könne, welcher Gedanke im zweiten Teile dieser Arbeit weiter 
fortgeführt werden soll. 
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9. Von solchen Versuchen, die Methode der kleinsten 
Quadrate theoretisch auf einfachste Prinzipien zu gründen, 
liess man in der Folgezeit ab; vielmehr machte sich eine 
entgegengesetzte, rein empirische Richtung geltend. An- 
statt nämlich nach solchen Prinzipien zu suchen, aus denen 
sich diese Methode allgemein und streng erweisen liesse, 
statuierte man den Fundamentalsatz vom Minimum der 
Fehlerquadrate selbst als die unumgängliche willkürliche 
Annahme, und überliess es der theoretischen Forschung, die 
Stellung dieses, für die Praxis unentbehrlich und unersetzlich 
gewordenen Hilfsmittels der reinen Mathematik gegenüber zu 
untersuchen. 

Einen solchen Standpunkt vertritt zuerst Fries.^) 
Er fixiert das zu lösende Problem so: Bei gegebener 
Fonktionsform sind die Konstanten derselben aus einer 
Reihe ungenauer Beobachtungen zu bestimmen. Dazu habe 
man mittlere Werte zu berechnen, welche die Summe 
der Abweichungen von den gegebenen Beobachtungsresultaten 
möglichst klein machen. „Ist aber von Fehlem die Rede, 
so wird es allgemeiner gelten, dass gleich grosse positive 
und negative vielmehr als gleich grosse Abweichungen neben- 
einander gelten. Alsdann ist die einfachste Voraussetzung, die 
Abweichungen nach ihrem Quadrate abzuschätzen und also zu 
fordern, dass die Summe der Quadrate ein Kleinstes werde. 
So werden wir hier auf die von Gauss gegebene Methode 
der kleinsten Quadratsummen geführt." 

Sodann betrachtet Fries auch die andere Herleitung 
des Fundamentalsatzes der Methode der kleinsten Quadrate 
aus der Wahrscheinlichkeitstransszendente. Drückt g)8 die 
feste Funktionsform aus, durch welche die Wahrscheinlich- 
keit eines Fehlers d durch diesen selbst dargestellt wird, 
so muss sich, unter Voraussetzung grösstmöglicher Sorgfalt 
bei den Beobachtungen, die Wahrscheinlichkeit, dass ein 
Fehler zwischen zwei Grenzen liege, rasch der Einheit nähern, 
wenn man diese Grenzen etwas weiter nimmt, es wird 
also nahezu 



1) Fries, Versuch einer Kritik der Prinzipien der Wahrscheinlich- 
keitsrechnung, Braunschweig 1842. 
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sein müssen. Dieser Funktionsform entspricht aber aus rein 
analytischen Gründen am einfachsten 

„und da unsere ausgleichende Rechnung eine willkürliche 
Voraussetzung zulässt, so sind wir unmittelbar berechtigt^ 
diese Form als die bequemste anzuwenden." 

Diese Betrachtungen sind aber oberflächlich und unmathe- 
matisch und zudem fehlt der ganzen Darstellung diejenige 
Eüarheit und Strenge des Ausdrucks, die man für diesen 
wichtigen Gegenstand zu wünschen Ursache hat. Schätzbar 
und wichtig ist aber, dass Fries darauf hinweist, es komme 
bei der „ausgleichenden Rechnung^ welche später ganz ge- 
bräuchlich gewordene Benennung er zuerst anwendet, darauf 
an, mittlere Werte zu finden. Diese Mittelwerte können 
für uns nur eine subjektive Wahrscheinlichkeit haben, und 
da wir zu einer willkürlichen Annahme darüber berechtigt 
und genötigt sind, was wir unter „mittleren Werten" über- 
haupt verstehen wollen, so liegt es nahe, als solche diejenigen 
anzusehen, welche die Methode der kleinsten Quadrate liefert. 
Damit erreicht man zugleich den Vorteil, Voraussetzungen 
über die Natur der Fehler, sowie deren Wahrscheinlichkeit 
ganz zu umgehen, und braucht Fragen dieser Art nur ein 
rein theoretisches Interesse zuzuschreiben, während man dem 
praktischen völUg genügt hat. 

10. Zu dieser Konsequenz wurde Gerling^) geführt. 
Er kam durch folgenden Gedankengang zu einer Lösung dea 
Ausgleichungsproblems. Hat man Beobachtungen in über- 
schüssiger Anzahl angestellt, so werden sich die unvermeid- 
lichen Fehler die in ihnen enthalten sind, dadurch bemerk- 
lich machen, dass die Beobachtungsresultate untereinander 
oder mit anderen Bedingungen in Widerspruch stehen. Diese 

1) Gerling, Die Ausgleichungsrechnungen der praktischen Geo- 
metrie, Hamburg und Gotha 1843. 
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Widersprüche machen es unmöglich, ans Beobachtnngsresultaten 
die absolnte Wahrheit zu finden; vielmehr mnss man sich 
begnügen, angenäherte Werte zu suchen, die man statt der 
Wahrheit selbst anzunehmen genötigt ist. Dazu gelangt man 
aber, indem man die Resultate der Beobachtungen so abändert, 
dass alle Widersprüche gänzlich aufgehoben werden, dass man 
jedoch dem unmittelbaren Zeugnis derselben immer so nahe 
als möglich bleibt; denn es ist diese Anbringung von 
Verbesserungen nur ein notwendiges Übel, das man bestrebt 
sein muss, so klein als nur möglich zu machen. „Diesem 
Bedürfnisse entsprechen wir nun, indem wir für die Grösse 
der Verbesserungen als Prinzip festsetzen, dass die Summe 
der Quadrate der Verbesserungen so klein als möglich werde.'' 
Man habe zwar diesen Satz auch auf Wahrscheinlichkeits- 
rechnung zu gründen gesucht, da man jedoch aus Unkenntnis 
des Gesetzes, durch welches die Grösse eines unvermeidlichen 
Fehlers mit seiner Wahrscheinlichkeit zusammenhängt, sich 
mit einer Hypothese darüber begnügen und ausserdem noch 
als Axiom den Satz vom arithmetischen Mittel aufstellen 
müsse, willkürliche Annahmen also unerlässlich seien, so 
ziehe er es vor, jene scharfsinnigen Untersuchungen nur 
historisch zu würdigen und das Prinzip als solches der Aus- 
gleichungsrechnung zu Grunde zu legen. 

So hält G erlin g mit voller Schärfe den rein empirischen 
Standpunkt ein: ihm ist der Satz vom Minimum der Fehler- 
quadrate eine willkürliche Annahme. Wenn nun aber auch 
die Natur des Problems eine gewisse Willkür erfordert, so 
ist dieselbe doch keineswegs so schrankenlos, als es nach 
den Auseinandersetzungen Gerlings scheinen möchte; viel- 
mehr erhellt, dass jede Methode, die zur Ausgleichung von 
Beobachtungen dienen soll, a priori gewisse, genau zu be- 
zeichnende Anforderungen zu erfüllen hat, widrigenfalls man 
sie als ein Ausgleichungsverfahren gar nicht ansprechen kann, 
und darüber, welche Methode diesen Forderungen am besten 
und einfachsten Genüge zu leisten vermag, ist eine Unter- 
suchung wohl am Platze; es ist nicht hinreichend, der schon 
gemachten Annahme als empfehlendes Moment beizulegen, 
dass sie die geforderten Eigenschaften besitze. Darüber kommt 
aber Gerling nicht hinaus: er führt als Vorzüge der von 
ihm gemachten Annahme an, dass sie den Satz vom arith- 
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metischen Mittel ia sich enthalte; dass sie der Forderung 
Bechnung trage^ Fehler von gleicher absoluter Grösse über- 
haupt als gleich ansehen zu können^ indem sie auf die mög- 
lichst einfache Weise die Zeichenverschiedenheit der Fehler 
beseitige; endlich dass sie den wahrscheinlichen Fehler des 
Resultates in engere Grenzen einschliesse, als dies etwa bei 
der Annahme des Minimums irgend anderer geraden Potenzen 
der Fehler der Fall sein würde. Die wesentliche Forderung 
linearer Endgleichungen berücksichtigt er gar nicht. — Diese 
rein empirische Betrachtungsweise erscheint also nicht völlig 
korrekt, so naturgemäss auch ihre Entstehung zu erklären 
ist, schon als Reaktion gegen die zu weit gehenden theoreti- 
schen Spekulationen, die das praktische Ziel oft ganz aus 
den Augen verloren. 

11. Einen anderen Weg zur Begründung der Methode 
der kleinsten Quadrate, der aber schon in den Ansichten von 
Fries vorgezeichnet ist, schlägt Reuschle^) ein. Derselbe 
beabsichtigt vorerst, die Begriffe von der Wahrscheinlichkeit 
der Fehler aus einer Unsicherheit und Unklarheit, die öftere 
falsche Anwendung allmählich über sie verbreitet hatte, zu 
retten. Er macht den bisherigen Begründungsversuchen der 
Methode der kleinsten Quadrate namentlich zum Vorwurf die 
Verwechselung der Wahrscheinlichkeit eines einzelnen Fehlers 
mit dem Verhältnisse, welches zwischen diesen Wahrschein- 
lichkeiten verschiedener Fehler stattfindet; oder die Verwechsel- 
ung der relativen Wahrscheinlichkeit (Häufigkeit, 
Möglichkeit, Leichtigkeit), die einem Fehler, verglichen mit 
anderen, zukommt, mit der absoluten Wahrscheinlich- 
keit desselben an sich, d. h. dass er einem vorliegenden 
Beobachtungsresultate wirklich anhafte. Diese letztere ist 
als die eines einzelnen Ereignisses unter unendlich vielen 
möglichen schlechthin Null für jede Grösse des Fehlers, und 
wird erst zu einer endlichen Grösse, wenn anstatt eines be- 
stimmten Fehlers ein unbestimmter, zwischen gewissen Gren- 
zen enthaltener Fehler betrachtet wird. Als Ausdruck für die 



1) Reuschle, Über die Deduktion der Methode der kleinsten 
Quadrate aus Begriffen der Wahrscheinlichkeitsrechnung, Grelles Jour- 
nal, 26. Bd., vom Jahre 1843. 
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Wahrscheinlichkeit, einen Fehler zu begehen, dessen Grösse 
zwischen den Grenzen a und h liegt, nimmt er das Integral 







untersucht die Eigenschaften der vorläufig unbestimmt gelas- 
senen Funktion g? und setzt schliesslich als plausibelste Form der- 
selben den Ausdruck ^ - 

g)X^ Cc""*^^ 

fest. Eine wirkliche Deduktion dieser wichtigen Exponential- 
grösse, aus der sodann die Berechtigung der Methode der 
kleinsten Quadrate gefolgert wird, giebt er nicht. Es muss 
daher auch dieser Begründungsweise der Vorwurf gemacht 
werden, dass sie auf die tiefer liegenden Gründe, warum man 
stets auf diese eine Annahme geführt wird, nicht eingeht und 
der Methode der kleinsten Quadrate ein Fundament giebt, 
welches deren Bestand sehr zweifelhaft machte, wenn derselbe 
nicht durch andere Stützen gesichert wäre. 

12. Den Gedanken, durch die Wahrscheinlichkeitstrans- 
szendente hindurch zu einer direkten Begründung der Methode 
der kleinsten Quadrate gelangen zu können, verfolgt noch in 
neuester Zeit eine Inaugural- Dissertation^). Der Verfasser 
stellt sich als Aufgabe den „Versuch einer Entwickelung der 
» Funktion ohne Position irgend welchen Axioms". Dies kann 
ihm freilich nicht gelingen; denn wenn er auch nicht irgend 
einen Satz bestimmt und klär als ein Axiom hinstellt, so wird 
er doch im Gange der analytischen Entwickelung mehrfach 
genötigt, plausible Voraussetzungen zu machen und willkür- 
liche Annahmen eintreten zu lassen, die schliesslich nur ver- 
hüllte Positionen von Axiomen oder Prinzipien sind. Er geht 
aus von den Eigenschaften der Wahrscheinlichkeitsfunktion (p, 
die dazu dienen, den Gang der sogenannten Wahrscheinlich- 
keitskurve zu illustrieren; danach ergeben sich für die beiden 
ersten Differentialquotienten von q)X gewisse Bedingungen, 
denen am einfachsten durch die Form 

wx «=» Ce ~ ^**** 
genügt wird. 

1) Gooss, Zur Begründung der Methode der kleinsten Quadrate, 
Kreuznach 1865. 
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Dass man ohne willkürliche Annahmen zu einem Resnltate 
überhaupt nicht gelangen konne^ giebt der Yer&sser selbst zu^ 
indem er sagt: ^^ Unter allen Annahmen, die man machen kann^ 
wird diejenige die brauchbarste sein, welche neben der Eigen- 
schaft , sämtliche an 'sie gestellte Forderungen zu befriedigen, 
auch noch die besitzt, für (px den bequemsten analytischen 
Ausdruck resultieren zu lassen^. — Durch die gegebene Her- 
leitung eines solchen Ausdruckes ist nur gezeigt worden, wie 
man, statt ohne weiteres diesen selbst anzunehmen, die An- 
nahme weiter hinausschieben könne an einen Punkt, wo es 
weniger zweifelhaft, welche Annahme von allen möglichen die 
plausibelste ist^). 

Es scheint aber überhaupt nicht gerechtfertigt, aus der 
Funktion für die Wahrscheinlichkeit der Fehler, wenn sie nicht 
wie bei Gauss die notwendige und genaue Folgerung aus 
Prinzipien ist, die Methode der kleinsten Quadrate selbst her- 
leiten zu wollen. In jedem anderen Falle nämlich kann diese 
Funktion nur als ein aus Nützlichkeitsgründen adoptierter 
mathematischer Ausdruck für Verhältnisse, die man als that- 
sächlich bestehend im allgemeinen annehmen muss, betrachtet 
werden; wenn man aber auf einen solchen Ausdruck die Be- 
rechtigung zur Anwendung der Methode der kleinsten Quadrate 
gründen wollte, so stünde dieselbe auf sehr unsicherem 
Fundamente, denn die geringste Abänderung der Form dieser 
Funktion, die vielleicht praktisch sehr wenig auf sich hätte, 
würde die Geltung der Methode vöUig aufheben oder zweifel- 
haft machen. Dies widerstreitet aber sehr dem Sinne, in welchem 
dieses Rechnungsverfahren jetzt ganz allgemein angewandt wird. 
Will man also zur Ableitung der Methode der kleinsten Quadrate 
Voraussetzungen über Wahrscheinlichkeit der Fehler und wahr- 
scheinlichste Werte überhaupt machen, so ist der von Gauss 
eingeschlagene Weg, dessen Ausgangspunkt das Prinzip vom 
arithmetischen Mittel ist, ebenso wie der naturgemässeste, 
einfachste und vorteilhafteste, zugleich der rationellste. 

13. Diesen Ausgang nimmt denn auch eine so bedeutende 
Autorität auf diesem Gebiete, wie Hansen, in seiner neuesten 



1) In diesem Sinne habe ich auch die in Rede stehende Ableitung 
weiter unten (§ 31 S. 54) selbst benutzt. 
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Arbeit*). Er spricht sich da so aus: „Gewöhnlich geht man 
bei der Ableitung dieser Methode im allgemeinen von den 
allgemeinen Prinzipien der Wahrscheinlichkeitsrechnung aus, 
aber es zeigt sich immer im Laufe der Entwickelungen, dass 
man damit nicht vollständig ausreicht, sondern immer im 
grösseren oder geringeren Maße den Satz zu Hilfe nehmen 
muss, dass bei der Bestimmung einer Unbekannten aus einer 
Anzahl von gleich guten Beobachtungen das arithmetische 
Mittel aus diesen der wahrscheinlichste Wert der Unbekannten 
sei. Da dieses sich so verhält, so nehme ich mir vor, diesen 
Satz als Axiom an die Spitze der Ableitungen zu stellen und 
aus demselben das Verfahren abzuleiten, welches zu befolgen 
ist, wenn die Werte mehrerer Unbekannten aus Beobachtungen 
von ungleicher Genauigkeit zu bestimmen sind und die Zahl 
dieser Beobachtungen grösser ist als die der Unbekannten. 
Ich wurde, wie sich voraussehen Hess, auf diese Weise auf die 
Methode der kleinsten Quadrate hingeführt." Die Deduktion 
von Hansen ist eine indirekte: er zeigt zuerst, dass das 
Prinzip vom arithmetischen Mittel nichts anderes ist, als die 
Bedingung für das Minimum der Fehlerquadrate für eine Un- 
bekannte; um denselben auch auf mehrere Unbekannte aus- 
zudehnen, stejlt er vermöge jenes Prinzipes gewisse Bedingungs- 
gleichungen auf und zeigt, dass die Resultate der Methode der 
kleinsten Quadrate dieselben erfüllen. Ein solcher indirekter 
Beweis ist zwar wissenschaftlich höchst interessant, aber doch 
viel weniger praktisch, als ein direkt geführter, weil er immer 
den Anschein giebt, als solle ein schon bekanntes Resultat 
noch einmal auf anderem Wege hergeleitet werden, wodurch 
der organische Gang einer vom Bekannten zum Unbekannten 
fortschreitenden analytischen Entwickelimg verloren geht. Auch 
in dieser Hinsicht ist der Beweis der Methode der kleinsten 
Quadrate, den Gauss gegeben hat und der in einer direkten 
Deduktion besteht, noch immer unübertroffen an Klarheit, 
Schärfe und Einfachheit. 

14. Schliesslich sind noch einige neuere Arbeiten von 
Franzosen auf diesem Gebiete anzuführen. Sie fussen fast alle 



1) Hansen, Von der Methode der kleinsten Quadrate im all- 
gemeinen und in ihrer Anwendung auf die Geodäsie. Abhandlungen 
der königl. sächs. Gesellschaft der Wissensch., Bd. VIIL Leipzig 1867. 



26 I- Darstellnng und Kritik der yerschiedenen BegrOndungsweisen 

auf der von Laplace gegebenen Analyse, durch welche die 
Giltigkeit der Methode der kleinsten Quadrate bewiesen wird 
unabhängig von der speziellen Form des Gesetzes der Wahr- 
scheinlichkeit eines Fehlers, wenn nur die Anzahl der Be- 
obachtungen eine sehr grosse ist. Eng an Laplace schliessen 
sich namentlich Poisson^) und Courno^^) an; Bienayme, 
der später eiue grosse Zahl von Aufsätzen über diese Materie 
veröflFentlicht hat, hielt sich selbständiger und ging in vielen 
Beziehungen weiter. Von grossem Interesse siad namentlich 
die Abhandlungen und Notizen^), die er gegen Cauchy schrieb, 
als er mit demselben über die Anwendung der Methode der 
kleinsten Quadrate bei der Interpolation in eiuen Streit geriet, 
der sich auch über diese Methode im allgemeinen verbreitete. 
Es kann hier nicht der Ort seiu, diesen Streit bis ins einzelne 
zu verfolgen, ich will nur eiuen Aufsatz von Bienayme*) 
hervorheben, in welchem er die Analyse von Laplace gegen 
Angriffe von Cauchy und Le Verrier verteidigt und zugleich 
eigene Betrachtungen über die Begründungsweise der Methode 
der kleinsten Quadrate giebt Dabei unterlässt er nicht, 
Irrtümer, die man sich mehrfach hat zu Schulden kommen 
lassen, zu berichtigen. Das Gesetz der Wahrscheinlichkeit 
der Fehler werde nicht mit Notwendigkeit durch* die Formel 

1 -,. . . 

"7= ^ repräsentiert; dieselbe gebe vielmehr nur einen be- 

y 7t 

quemen Näherungsausdruck. Dagegen sei das Mittel aus den 
Quadraten der Differenzen zwischen den Fehlern und ihrem 
mittleren Werte, welcher Ausdruck in der Laplaceschen 
Entwickelung eine so hervorragende Rolle spielt, weder ein 
Näherungsausdruck, noch auch, wie Gauss wollte^), ein 
willkürlich angenommenes Maß der Genauigkeit. „Tout au 



1) Poisson, Sur la probdbiliU des resultats moyens des ohser- 
vations. Connaissance des Tems pour Van 1827, Additions pag. 273. — 
Suite du mim. sur la prob. etc. Conn. des Tems pour Van 1832, Addit. 
pag. 3. 

2) Cournot, Exposition de la theorie des chances et des proba- 
bilites. Paris 1843. 

3) Comptes rendus vom Jahre 1853, Bd. 37. 

4) Considerations ä Tappui de la decouverte de Laplace sur la loi 
de probdbilite dans la methode des moindres carres. I.e. pag. 309. 

5) Vergl. oben § 4 S. 10. 
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contraire^ la moyenne des carr^s renferme la condition fondamentäle 
du developpement des probabilites ä mesure que les dbservations 
se multiplient; et s'il n^est pas permis de dire ä priori qu!on ne 
sawrait trouver quelque fonction plus avantageuse {autre que les 
nwyennes de degre pair)y on peut affirmer que dans Vhypothese 
cPune teile decouverte la fonction pourrait etre remplacee par un 
emploi convenable de la moyenne des carris** Er beweist dies, 
indem er zeigt, wie die Annalime anderer Potenzen immer auf 
das Mittel der Quadrate zurückführt, und schliesst daraus, 
dass man durch Betrachtung dieses letzteren auf die Resultate 
der Methode der kleinsten Quadrate in dem Maße immer ge- 
nauer hingeleitet werde, als sich die Anzahl der Beobachtungen 
vergrössert. Der Ausdruck übrigens, dass die Laplacesche 
Analyse für jedes beliebige Gesetz der Wahrscheinlichkeit der 
Fehler gelte, welchen Cauchy lebhaft angegriffen, sei aller- 
dings zu allgemein, aber selbstverständlich könne man nur 
von solchen Gesetzen überhaupt sprechen, die den ohne weiteres 
einleuchtenden praktischen Anforderungen entsprächen, vor 
allem der, dass die Resultate desto genauer werden müssen, 
je grösser die Zahl der Beobachtungen ist. 

In einer späteren Abhandlung^) giebt derselbe Autor noch 
eine Umgestaltung der bisherigen Berechnung der Grenzen, 
zwischen welchen der sogenannte wahrscheinliche Fehler eines 
Resultates enthalten seio kann. Auf die gewöhnliche Weise 
erhalte man nämlich in dem Falle, wo mehrere Unbekannte 
zu bestimmen sind, immer nur die Wahrscheinlichkeit eines 
Fehlers, ganz abgesehen von den übrigen gleichzeitig vor- 
j handenen. Er stellt nun für die Wahrscheinlichkeit, dass 

j bei m Unbekannten die Fehler eine gewisse Grenze nicht über- 

I steigen, den Ausdruck 

2 

auf, welcher umgekehrt dazu dient, jene Grenze zu berechnen 
für einen gewissen Wert von p, Bienayme beweist schliess- 

1) Bienaym^, Memoire 8ur la prohahüite des erreurs d'api'es Ja 
niMiode des moindres carres. Mem. pres, ä VAcad. des sciences de VInst, 
Imp, Tome XV, Paris 1858, pag, 615. 
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lieh, dass bei AnwenduDg der Methode der kleinsten Quadrate 
•die Fehler in die möglichst engsten Grenzen eingeschlossen 
bleiben, oder dass, wenn diese Grenzen gegeben, die Wahr- 
scheinlichkeit dafür möglichst gross wird, dass die Fehler über 
dieselben nicht hinaus fallen. 

Durch diese zuletzt betrachteten höchst subtilen und kom- 
plizierten Untersuchui^en ist doch für die eigentliche Begrün- 
dung der Methode der kleinsten Quadrate nichts wesentlich 
Neues gegeben. Ich verlasse daher dieselben, um mich zu 
Betrachtungsweisen zu wenden, die zu einer allgemeineren Auf- 
fassung der Methode der kleinsten Quadrate hinführen werden. 



IL 



Übergang zu einer allgemeineren Anffassnng^ 
der Methode der kleinsten Quadrate. 



15. Alle im Vorhergehenden betrachteten verschiedenen: 
Begründungsweisen der Methode der kleinsten Quadrate kom- 
men darauf hinaus, den Fundamentalsatz vom Minimum der 
Pehlerquadrate als das notwendige Prinzip zur Lösung der Auf- 
gabe der Ausgleichung von Peobachtungsresultaten aufzustellen. 
Aber es giebt auch in der reinen Mathematik eine Anzahl 
Aufgaben, die im allgemeinen denselben Charakter haben, 
wie das Problem der Ausgleichung, und bei denen schon das 
praktische Gefühl darauf hingewiesen hat, zu ihrer Lösung die 
Methode der kleinsten Quadrate zu benutzen, obschon man 
nach dem gewöhnlichen Sinne derselben dazu nicht ohne 
weiteres berechtigt ist. Wenn z. B. verlangt wird, eine Kurve 
von gegebener Gleichungsform zu suchen (d. h. die speziellen 
Werte ihrer Parameter zu bestinmien), die gewissen gegebenen 
Punkten sich so nahe als möglich anschliesst, so könnte man 
sich allerdings denken, diese Punkte seien durch Beobachtung 
gefimdene Punkte der zu bestimmenden Kurve; aber dies wäre 
nur so lange gestattet, als diese Punkte innerhalb der engen 
für Beobachtungen zulässigen Grenzen von der Kurve abwichen; 
wenn dieselben jedoch ganz beliebig liegen, kann von einer 
Ausgleichung von Beobachtungsresultaten nicht mehr die Rede 
sein. Dennoch wird man auch hier die Methode der kleinsten 
Quadrate anwenden, da kein Grund vorhanden ist, warum man 
die Lösung dieser Aufgabe > wo die Abweichungen beliebig gross. 
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sind, durch ein anderes Prinzip versuchen sollte. Oder man 
denke sich die Aufgabe gestellt: zu einem gegebenen System 
von Punkten denjenigen Punkt zu suchen, welcher allen ein- 
zelnen zugleich möglichst nahe liegt. Sind diese Punkte selbst 
nur wenig von einander entfernt, so hat ohne Zweifel die 
Legen dresche Betrachtungsweise^) statt, wonach der gesuchte 
Punkt der Schwerpunkt des Punktesystemes ist. Aber auch 
wenn die Punkte beliebig im Räume liegend angenommen 
werden, bleibt keine Wahl übrig, als jene Lösung zu ver- 
allgemeinem. Endlich, wenn man sich Beobachtungsresultate 
vorstellt, deren Abweichungen ausserhalb aller Grenzen zu- 
lässiger Beobachtungsfehler liegen, von deren Ausgleichung 
man also nicht mehr sprechen kann, so entsteht die Frage, 
wenn man doch auch auf diese die Methode der kleinsten 
Quadrate anwendete, was bedeuten dann die dadurch erhaltenen 
Resultate? 

Durch derartige Betrachtungen wird man auf den Gedanken 
geführt, ob nicht der Methode der kleinsten Quadrate eine 
allgemeinere Bedeutung, als die eines Prinzips zur Ausgleichung 
von Beobachtungen, zuzuschreiben sei und ob dieselbe nicht 
auf allgemeinere Grundlagen basiert werden könne, so dass 
sie auch noch anwendbar bleibt, wenn man es nicht mit 
Beobachtungsresultaten, Fehlern und wahrscheinlichsten Werten 
zu thun hat. Dieser Gedanke ist, so viel mir bekannt, bis 
jetzt noch nicht ausgesprochen worden, und so oft man auch, 
wie dazu fast jedes Lehrbuch dieses Gegenstandes Anleitung 
giebt, derartige Aufgaben mittelst der Methode der kleinsten 
Quadrate löste, kam man doch nie zu dieser Konsequenz. 
Dies ist um so befremdlicher, als es nur eines Schrittes be- 
durft hätte, um gerade von den ältesten Betrachtungsweisen 
des Problems der Ausgleichung, lange bevor an eine eigent- 
liche Ausgleichungsrechnung in unserem Sinne zu denken war, 
zu einer allgemeineren Auffassung geleitet zu werden. 

16. Jene frühesten Betrachtungsweisen des Ausgleichungs- 
problems waren vorwiegend geometrisch. So giebt Cotes^) 

1) Vergl. oben § 2 S. 7. 

2) Vergl. Laplace, TMorie andlytique etc. 11^^ idiU Introd, CV 
et pag. 346. 
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zuerst ein Verfahren, um aus mehreren ungleich gewichtigen 
Beobachtungswerten für eine Grösse einen mittleren Wert für 
dieselbe herzuleiten. Er betrachtet die Beobachtungswerte als 
Strecken, trägt sie von einem Punkte aus auf einer Geraden 
nach derselben Richtung hin ab, denkt sich an den Endpunkten 
dieser Strecken Massen angebracht, die den Gewichten der 
Beobachtungswerte proportional sind, und sucht nun von 
diesen Massen den Schwerpunkt; der Abstand desselben 
von dem Ausgangspunkt repräsentiert dann den gesuchten 
Wert. — Ganz das nämUche Verfahren giebt auch Lagrange 
an^). 

Besonders interessant aber ist die Darstellung Lamberts. 
Nachdem er in einem früheren Werke*) beiläufig verschiedene 
Sätze über den Gebrauch einfacher und zusammengesetzter 
Mittelwerte gegeben, behandelt er in einer späteren Arbeit^) 
den komplizierteren Fall, wo die Beobachtungsresultate abhängig 
sind von zwei veränderlichen Grössen. Weiss man nun, dass 
dieselben, wären sie völlig genau, durch eine lineare Gleich- 
ung mit einander verknüpft sein müssten, so hat man zur 
Ausgleichung der Beobachtungen die geometrische Aufgabe 
zu lösen: diejenige Gerade zu ziehen, die von mehreren ge- 
gebenen Punkten möglichst wenig abweicht, vorausgesetzt, dass 
keinem der Punkte irgend ein Vorzug vor den anderen zu- 
kommen soll. Dann müssen, wenn man sich die verlangte 
Gerade gezogen denkt, die Punkte auf der einen Seite derselben 
so viel abweichen als auf der anderen, oder die Summe der 
Abstände der Punkte von dieser Geraden muss auf beiden 
Seiten dieselbe sein. Diese Eigenschaft hat aber jede gerade 
Linie, die durch den Schwerpunkt der gegebenen Punkte 
geht. Kennt man nun femer das Verhältnis der Abscissen 
und Ordinaten, so giebt das Verhältnis der berechneten Koor- 
dinaten des Schwerpunktes die Neigung der Geraden an; diese 

1) In dem S. 16 Note 4 zitierten Aufsätze, von dem Encke in 
der Note 3 angeführten Abhandlung den ersten Teil vollständig über- 
setzt, den anderen auszugsweise mitgeteilt hat. 

2) Lambert, Photometria. Äugustae Vindelicorum MDCCLX 
§ ^7 sqq, 

3) Lambert, Die Theorie der Zuverlässigkeit der Beobachtungen 
und Versuche, in dem Sammelwerke: Beyträge zum Gebrauche der 
Mathematik und deren Anwendung, Berlin 1765, S. 424. 
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selbst ist demnacli, da ein Punkt derselben und ihre Neigung 
bekannt ist, völlig bestimmt. — Lambert betrachtet auch 
den Fall, wo die Gleichung zwischen den beiden Veränder- 
lichen nicht mehr vom ersten Grade ist, wo man also geometrisch 
die Aufgabe vor sich hat, eine Kurve von bekannter Gleichung 
so zu legen, dass sie sich gegebenen Punkten möglichst an- 
schliesst, oder wie er sich ausdrückt, „dass sie zwischen allen 
Observationen das wahre Mittel halte". Hierbei verlässt er 
jedoch die geometrische Anschauung und wendet ein vöUig 
willkürliches Kombinationsverfahren an, um so viele Gleich- 
ungen zu erhalten, als unbekannte (nämlich die Konstanten 
der Kurve) zu bestimmen sind. Betrachtet man daher nur 
jenen einfacheren Fall, so muss man sagen: Lambert macht 
die willkürliche Annahme, dass die Summen der Abstände der 
auf beiden Seiten der Geraden liegenden Punkte gleich gross, 
sein sollen; und diese Annahme ist nötig, um die sonst vage 
Forderung zu definieren, dass sich die gerade Linie den ge- 
gebenen Punkten „möglichst gut" anschliessen soll. Diese De- 
finition enthält aber keine Bestimmung darüber, ob die Punkte 
wenig oder mehr von dem Zuge einer Geraden abweichen^ 
sie gilt also auch noch, wenn die Punkte irgend beKebig in 
der Ebene liegend angenommen werden. Dann ist durch 
Zugrundelegung jenes Prinzips die allgemeine Auflösung der 
Aufgabe ermöglicht: zu irgend beliebig gegebenen Punkten in 
einer Ebene diejenige gerade Linie zu konstruieren, welche 
diesen Punkten allen „möglichst nahe" vorbeigeht. 

17. Li gleicher Weise wie diese von Lambert behandelte 
Aufgabe, charakterisieren sich die oben angeführten Probleme 
durch solche Forderungen in Ausdrücken („möglichst nahe 
liegen", „möglichst gut anschliessen", „möglichst gut genügen" 
u. a.), die nicht olme weiteres eine mathematische Deutung 
zulassen; es kommt daher bei derartigen Aufgaben, die man 
vielleicht als Aufgaben des möglichst nahe Liegens 
bezeichnen kann, auf eine Definition dieser vagen Forderungen 
an; und diese Definition, die natürlich willkürliche Annahmen 
erheischt, giebt dann das zur Lösung dieser Aufgaben not- 
wendige Prinzip. Durch weitere Untersuchungen im dritten Teile- 
der vorliegenden Arbeit wird sich zeigen, dass ein solches Prinzip 
in dem Fundamentalsatz der Methode der kleinsten Quadrate,, 
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wenn man dieselbe in allgemeinerem Sinne nimmt als bisher 
geschehen, enthalten ist. In diesem Abschnitt will ich durch 
Betrachtung einiger spezieller Aufgaben den Sinn einer solchen 
Verallgemeinerung zu erläutern und auf die Behandlung des 
allgemeinen Problems vorzubereiten suchen. 

18. Es sei die Aufgabe vorgelegt: zu einem beliebig im 
Räume gegebenen Punktsystem denjenigen Punkt zu suchen, 
welcher allen einzelnen möglichst nahe liegt, und welcher, 
um kurz zu reden, der Mittelpunkt des Punktsystemes ge- 
nannt werden soll. Dieser Begriff ist im allgemeinen vag; 
denkt man sich jedoch die Aufgabe in ihrer einfachsten Ge- 
stalt, wo nämlich nur zwei Punkte gegeben sind, so ist es 
dann nicht mehr zweifelhaft, welchen Punkt man als Mittel- 
pimkt dieser beiden zu bezeichnen habe: offenbar den Halbierungs- 
punkt der Verbindungsgeraden. Dies lässt sich zwar nicht 
beweisen und involviert in dieser Hinsicht eine gewisse Will- 
kür; allein es zeigt unmittelbar die Anschauung, dass es nicht 
möglich ist, irgend einen anderen Punkt zu finden, dem man 
mit demselben oder grösserem Rechte die Eigenschaft beilegen 
könnte, beiden gegebenen Punkten zugleich möglichst nahe 
zu hegen. Dabei ist stillschweigend vorausgesetzt, dass beide 
Punkte einen völlig gleichen Einfluss auf die Bestimmung des 
Mittelpunktes haben sollen; will man jedoch dem einen Punkt 
A^ einen Vorzug vor dem andern A2 einräumen, so wird offen- 
bar der Mittelpunkt M näher an Ä^^ als an A^ liegend an- 
genommen werden müssen. Auch in diesem Falle wird es am 
einfachsten sein, M auf der Verbindungsgeraden anzunehmen; 
denn zu jedem ausserhalb derselben liegenden Punkte, den man 
als Mittelpunkt betrachten könnte, lässt sich stets ein ande/er 
angeben, nämlich der zu dem ersteren in Beziehung auf Ä^A^ 
in* derselben Ebene symmetrisch liegende, welchem man ein 
vöUig gleiches Recht einzuräumen hätte. Diese Unbestimmt- 
heit fällt nur bei den Punkten der Verbindungsgeraden weg. 
Schreibt man nun dem Punkt A^ einen m-mal so grossen Ein- 
I fluss auf die Bestimmung des Mittelpunktes als dem Punkte A^ 
zu, so wird man M auf A^A2 dergestalt bestimmen, dass 
derselbe von Aj^ m-mal so weit entfernt ist als von A2, dass 
also: 

MA^^ m MA^y oder MAj^ : MA^ — 1 : m. 

Henke, Methode der kleinsten Quadrate. 2. Aufl. 3 
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Drückt man das Verhältnis l:m als Verhältnis zweier ganzen 
Zahlen ii^^iii^ ^ns^ so kann man diese als Maße des Ein- 
flusses bezeichnen und hat dann: 



d. h. die Entfernungen verhalten sich umgekehrt wie die Maße 
des Einflusses. Wegen einer bemerkenswerten Analogie em- 
pfiehlt es sich, diese Zahlen die Gewichte der Punkte zu 
nennen; denn es fällt dann der Mittelpunkt mit dem Schwer- 
punkte der Punkte Ä^ und A^ zusammen, wenn man sich an 
denselben die Gewichte ft^ und /itg wirkend vorstellt. 

Die Ausdrücke „Einfluss^^, „Maß des Einflusses" und dem- 
gemäss auch der Begriff des Gewichtes sind im allgemeinen 
allerdings unklar; in speziellen Fällen ergiebt sich jedoch ihre 
Bedeutung von selbst. Denkt man sich z. B. drei Punkte von 
gleichem Gewichte, und lässt zwei derselben einander immer 
näher rücken und endlich zusammenfallen, so ist klar, dass 
bei Aufsuchung des Mittelpunktes der beiden übriggebliebenen 
Punkte derjenige, in welchem zwei Punkte zusammengefallen 
sind, als ein doppelter Punkt zu gelten hat und ihm das 
doppelte Gewicht beizulegen ist. Giebt man also einem Punkt 
ein Gewicht fi, so kann man annehmen, dass in demselben (i 
Punkte vom Gewicht 1 zusammengefallen sind. 

19. Sind nun drei Punkte gegeben, zu denen der Mittel- 
punkt gesucht wird, so lassen sich die oben erhaltenen Sätze 
anwenden. Unter Voraussetzung gleicher Gewichte der Punkte 
ist der Halbierungspunkt M* der Geraden A^Ä2 der Mittel- 
punkt von Ai und -^g; sucht man nun weiter von diesem 
Punkt Jf ' und dem noch übrigen A^ den Mittelpunkt M^ so 
wird es am einfachsten sein, diesen Punkt M als Mittelpu^jkt 
der drei Punkte A^yA^^A^ anzusehen^). Dabei hat man aber 
jBf' als Mittelpunkt zweier Punkte, der im weiteren diese 

1) In Beziehung auf die Analogie zwischen der Aufsuchung des 
Mittelpunktes zu gegebenen Punkten und der Rechnungsoperation der 
Addition, repräsentiert diese Annahme das assoziative Prinzip, 
welches man hier, wenn unter der Bezeichnung M(P, §, . . ) der „Mittel- 
punkt der Punkte P, §,..." verstanden wird, symbolisch ausdrücken 
kann durch 
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beiden Punkte gewissermassen vertritt, das doppelte Gewicht 
zuzuschreiben und also M auf der Geraden M^A^ so zu be- 
stimmen, dass 



wird. Nach bekannten Eigenschaften des Dreiecks würde sich 
! derselbe Punkt ergeben haben, wenn man von zwei anderen 
I Punkten ausgegangen wäre. 

Die Art und Weise der successiven Weiterföhrung der 
Konstruktion ergiebt sich nun unmittelbar: kommt noch ein 
vierter Punkt hinzu, so sucht man den Mittelpunkt von drei 
Punkten und kombiniert diesen mit dem vierten, indem man 
ersterem das dreifache Gewicht beilegt u. s. f. Im allgemeinen, 
wenn der Mittelpunkt M von n Punkten zu suchen ist, und 
der Mittelpunkt Jf' von n — 1 derselben ist schon bestimmt, 
so hat man M auf der Geraden M^An so anzunehmen, dass 



MM':MAn^l:(n-l), MW^-M!An 

n 

wird. Dann ist auch klar, dass, wenn man die n Punkte in 
eine Anzahl von Gruppen teilt und von jeder Gruppe den 
Mittelpunkt sucht, der Hauptmittelpunkt als Mittelpunkt der 
Gruppenmittelpunkte zu betrachten ist, wobei jedem derselben 
ein Gewicht gleich der Anzahl der in der betreffenden Gruppe 
vereinigten Punkte beigelegt wird. Es lassen sich demnach 
auch Punkte mit verschiedenen Gewichten betrachten als Mittel- 
punkte so vieler Punkte vom Gewicht 1, als die Gewichts- 
zahl angiebt. 

So gelangt man konstruktiv zu der Lösung, dass der 
Mittelpunkt eines Punktsystemes mit dessen Schwerpunkt zu- 
sammenfällt, wenn man den Begriff „Gewicht" im mechanischen 
Sinne versteht. Nun hat der Schwerpunkt die Eigenschaft, 
dass die Summe der Quadrate der in die Gewichte, die an den 
Punkten wirken, multiplizierten Abstände der Punkte vom 
Schwerpunkte ein Minimum wird; nennt man daher die Ab 
stände der Punkte vom Mittelpunkt ri,r2,...r„ und die be- 
treffenden Gewichte f*i,f*2;---f*«; ^^ ^s^* 



n 

^ ^k rk^ — Min. 



X;al 



36 n* Übergang zu einer allgemeineren Auffassung 

ffierin Kegt augenscheinlich eine Erweiterung des Putt- 
damentalsatzes der Methode der kleinsten Quadrate; denn 
diese Gleichung sagt aus, dass der Mittelpunkt eines be- 
liebigen Punktsystemes so bestimmt wird, als Wenn die ein- 
zelaen Punkte die durch Beobachtung gefundenen Lagen 
eines Punktes wären und dessen wahrscheinlichste Lage ge- 
funden werden sollte. Beide Aufgaben sind also nicht ver- 
schieden und werden durch die Methode der kleinsten Qua- 
drate gelöst. 

20. Auf gleiche Weise kann man die analytische Auf- 
gabe behandeln, welche dieser geometrischen analog ist: zu 
einem beliebigen Systeme von Werten den Mittelwert aufzu- 
suchen, wo dann unter Mittelwert derjenige Wert verstanden 
wird, der sich von den einzelnen Werten am wenigsten unter- 
scheidet, oder denselben „möglichst nahe" liegt. Geht man 
auch hier von dem einfachsten Fall zweier gegebener Werte 
aus, so wird man als ihren Mittelwert unzweifelhaft denjenigen 
zwischen ihnen liegenden Wert zu betrachten haben, welcher 
sich von dem kleineren von ihnen um gerade so viel unter- 
scheidet, als von dem grösseren, vorausgesetzt nur, dass 
keinem der beiden Werte ein Vorzug vor dem anderen ein- 
geräumt werden muss; dieser Wert ist aber das einfache 
arithmetische Mittel aus den beiden gegebenen Werten. Das- 
selbe ergiebt sich schon durch die Analogie dieser Aufgabe 
mit der vorher betrachteten. Durch zwei Punkte kann man 
sich nämlich zwei Werte dargestellt denken; der Mittelpunkt 
dieser Punkte entspricht dann dem arithmetischen Mittel der 
beiden Werte, das füglich als der Mittelwert derselben gelten 
muss. Nun kann man ebenso vde bei der geometrischen Auf- 
gabe fortschliessen, für Werte ebenfalls den Begriff des Ge- 
wichtes einführen, dann mehr als zwei Werte annehmen u. s. w. 
Schliesslich wird man als Mittelwert eines Systemes von Werten 
öj , ttg , . . . a«, welchen die Gewichtszahlen |^i , ftg , . . . jii» resp. zu- 
kommen, das zusammengesetzte arithmetische Mittel dieser 
Werte, d. h. den Ausdruck: 

i^i ö^i + ffrg «2 + • • • + f^n «» 

ff^ SS '— = = !!— = = 

i^l + f*2 + • • • + f*« 

erhalten. Dieser Wert hat aber die Eigenschaft, dass 
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n 



^ fik (m — akf — Min. 

wird. Den Mittelwert eines Wertsystemes erhält man sonach 
auf dieselbe Weise, wie man aus einer Anzahl von Beobachtungs- 
resultaten für eine Grösse den wahrscheinlichsten Wert dieser 
Grösse zu ermitteln hat; nämlich mittelst der Methode der 
kleinsten Quadrate. 

21. Endlich lassen sich diejenigen Begründungsweisen der 
Methode der kleinsten Quadrate, welche auf Wahrscheinlichkeits- 
prinzipien nicht zurückgehen, dergestalt verallgemeinem, dass 
die Methode auch bei dem allgemeinen Problem der Auflösung 
überzähliger Gleichungen benutzt werden kann. So nament- 
lich die Betrachtung von Gerling^), welche sich ohne weiteres 
ausdehnen lässt auf ganz beliebige Gleichungen, die nicht als 
aus Beobachtungsresultaten hervorgebend angesehen zu werden 
brauchen. Auch eine Begründung der Methode der kleinsten 
Quadrate von Richelot^) kann man auf folgende Weise ver- 
allgemeinem. 

Es sei gegeben ein System linearer Gleichungen, deren 
Anzahl grösser ist als die der daraus zu bestimmenden Un- 
bekannten, z. B. die m Gleichungen mit den Unbekannten o;, y, z: 

a^x + \y -\- c^z + d^^O 
a^x + \y + ^2^ + dg « 

dmX + Imy + CmZ + ^^ «« 0. 

Dieselben können, wenn m>3, nicht streng erfüllt werden; 
vielmehr erhalten bei Einsetzung irgend welcher Werte für 
x^VjZ die linken Seiten Werte v^j v^y^v^j die im allgemeinen 
stets von Null verschieden sind. Um nun zu sehen, wie man 
die Unbekannten am besten bestimmen kann, multipliziert man 
die gegebenen Gleichungen mit den vorläufig noch unbestimmten 
Koeffizienten 5n §2? • • • ^wi; welche den Bedingungen unterworfen 
sind 



1) Vergl. oben § 10, S. 20. 

2) Dieselbe ist, soviel ich weiss, bis jetzt noch nicht veröffent- 
licht worden; ich verdanke ihre Kenntnis einer Vorlesung des Herrn 
Dr. Mayer an der Universität Leipzig im Sommer 1868. 
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m m 

Asl Aal 

und addiert die multiplizierten Gleichungen; dadurch ergiebt sich 

^ — — T^ r- + 



Die beste Bestimmung von x wird nun die sein, bei welcher 
das zweite Glied, das die v enthält, den möglichst kleinsten 
Wert bekommt, und dieser Fall tritt ein, wenn man 27aA&i 
möglichst gross macht. Dieser Ausdruck hat jedoch als lineare 
Funktion kein Maximum, wenn nicht noch eine Bedingungs- 
gleichung fiir die § mindestens vom zweiten Grade hinzukommt; 
die denkbar einfachste Form einer solchen ist aber: 

6l ~r §2 "T • • • ~r bm ■** !• 

Berechnet man unter den drei Bedingungen für die | das 
Maximum von £ahh nach der Lagrang eschen Multiplika- 
torenmethode, so erhält man 

[da] + ß [db] +y[dc] 

[ad] + ß [ab] + y [ac] 

als denjenigen Wert von ic, der den gegebenen Gleichungen 
am besten genügt. Die ß und y sind zu bestimmen aus den 
Gleichungen: ^j^j ^ ß |-j jj ^ ^ |-j^j _ q, 

[ca] + ß[cb] + y[cc]^0. 

Ähnliche Ausdrücke erhält man auf gleiche Weise für die 
besten Werte der beiden andern Unbekannten; dieselben stimmen 
aber mit denjenigen überein, welche die Methode der kleinsten 
Quadrate liefert. 

An dieser rein mathematischen Begründungsweise ist nur 
auszusetzen — abgesehen davon, dass sie Richelot selbst in so 
allgemeinem Sinne nicht hat geben wollen -, dass man durch sie 
nicht direkt zu der Methode der kleinsten Quadrate geführt 
wird, und sie nicht zeigt, wie der Fundamentalsatz derselben sich 
als das zur Lösung des Problems notwendige Prinzip ergiebt. Es 
konmit dies daher, dass die Forderung der Aufgabe, durch welche 
sich dieselbe als Aufgabe des möglichst nahe Liegens dokumen- 
tiert, nicht weiter analysiert wird. Ich will nun versuchen darzu- 
thun, wie man durch nähere Betrachtung dieser vagen Forderung 
zu einer allgemeinen Definition derselben geführt werden kann. 
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Versuch der Begrftiidimg der Methode der kleinsten 
Quadrate in yerallgemeinerter Auffassung und 

Anwendungen derselben. 



22. Die im vorigen Paragraphen betrachtete Aufgabe der 
Auflösung überzähliger Gleichungen repräsentiert in ihrer 
völligen Allgemeinheit das Problem des möglichst nahe Liegens, 
analytisch betrachtet. Denn bei allen derartigen Aufgaben 
erhält man Gleichungen in grösserer Anzahl^ als die der daraus 
zu bestimmenden Unbekannten; da dieselben also streng zu 
erfüllen im allgemeinen unmöglich ist, so fragt man nach 
denjenigen Werten der Unbekannten, die den gegebenen Gleich- 
ungen „möglichst genau" genügen. Z. B., um die beiden vor- 
her betrachteten speziellen Aufgaben hiernach zu beurteilen, 
handelt es sich bei der Auffindung des Mittelpunktes eines 
Punktsystems darum, denjenigen Punkt zu bestimmen, dessen 
Koordinaten den Gleichungen 

^i""0, r2 — 0,...r„— 

möglichst nahe genügen. Ebenso kommt es bei der Aufsuchung 
des Mittelwertes eines Wertsystems darauf an, einen Wert m 
zu ermitteln, der die Gleichungen 

möglichst genau erfüllt. 

Man kann hiemach das allgemeine Problem dergestalt 
fixieren: Es sind zur Bestimmung der m Unbekannten Mj, 
**2> •••**»» gegeben die n Gleichungen 
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U^^O, C72«0,... Z7n— 0, n>m, 

und man soll diejenigen Werte für die Unbekannten finden, 
welche diese Grleichungen möglichst genau erfüllen. Unmittelbar 
erhellt, dass das erste Ausknnftsmittel, welches man ergreifen 
könnte — etwa aus den gegebenen Gleichungen eine solche 
Anzahl nach irgend welchen Prinzipien auszuwählen, die zur 
Bestimmung der Unbekannten notwendig und hinreichend ist, 
und alle übrigen zu ignorieren — gänzlich unzulässig ist. 
Vielmehr wird es darauf ankommen, ein rationelles Verfahren 
zu finden, durch welches man aus allen n Grleichungen ein 
neues System von m Gleichungen 

^i=-0, F2-O,... Vm-0 

herleiten kann, welches zur Bestimmung der Unbekannten zu 
dienen hat. Dabei kann man sich noch die Forderung gestellt 
denken, dass einigen der Gleichungen tJ strenger genügt 
werden solle, als anderen, womit man auf den aus der Be- 
trachtung der speziellen Aufgaben schon klaren Begriff des 
Gewichtes für die Gleichungen geführt wird. Es soll jedoch 
vorläufig vorausgesetzt werden, dass die Gleichungen U sämt- 
lich das Gewicht 1 haben sollen; die Verallgemeinerung wird 
sich später leicht ergeben. 

23. Denkt man sich nun ein solches System von Gleich- 
ungen V irgendwie konstruiert, die Werte der Unbekannten u 
daraus berechnet und in das gegebene System U eingesetzt, 
so wird man im allgemeinen statt der Gleichungen J7 « 
erhalten: 

Diese Grössen (J, welche die Differenzen darstellen zwischen 
den Forderungen und den Resultaten, ändern sich, wenn die 
u aus einem anderen System F, welches man auf andere Weise 
aus den ü erhalten hat, bestimmt werden; und die speziellen 
Werte derselben geben den einzig möglichen Anhalt, um zu 
beurteilen, ob ein System der u die Gleichungen TJ genauer 
erfüllt, als ein anderes, so zwar, dass, je näher diese Grössen 
der Null kommen, desto genauer das entsprechende System der 
u den Gleichungen V genügt. Da man nun aber nicht die 
einzelnen Werte der 8 zu betrachten hat, sondern gleichzeitig 
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den Komplex aller, so wird dies nicht anders möglich sein, 
als dass man eine Funktion dieser Grössen konstruiert, deren 
einzelne Werte einen Aufschluss geben können, wie genau 
die Gleichungen U durch das betreffende System der u erfallt 
werden. Von dieser Fimktion kann man sogleich mehrere 
Eigenschaften angeben, die dieselbe notwendig besitzen muss, 
wenn sie zu dem angeführten Zwecke dienen soll. Zuerst muss 
dieselbe alle Grössen d in gleicher Weise enthalten, da keine 
derselben irgend welchen Vorzug vor den anderen haben soll, 
d. h. die Funktion muss symmetrisch in Bezug auf die d sein. 
Femer können auf die speziellen Werte der Funktion die 
Vorzeichen der 8 keinen Einfluss haben; denn es ist ganz 
gleichgiltig, nach welcher Seite hin die Werte der d von Null 
abweichen, und wenn zwei Systeme w, in die Gleichungen U 
substituiert, dieselben absoluten Werte d, nur alle mit ent- 
gegengesetzten Zeichen, hervorbrächten, so würde man dieselben 
als gleich genau genügend zu betrachten haben. Die in Rede 
stehende Funktion wird daher auch eine gerade sein müssen, 
in der also z. B. nur gerade Potenzen der d vorkommen können. 
Ausserdem muss die Funktion immer eindeutig bleiben und 
kann, welches auch die Werte der d sein mögen, stets nur 
ein und dasselbe Vorzeichen haben. Endlich ist klar, dass 
sich diese Funktion immer in demselben Sinne ändern muss, 
also nur wächst oder nur abnimmt. Je nachdem das Erstere oder 
das Letztere der Fall ist, wird man sagen müssen, dass, je 
kleiner der Wert der Fimktion ist, desto genauer oder desto 
weniger genau das entsprechende System der u den 
Gleichungen U Genüge leistet. Daraus folgt aber, dass 
man das System der u als dasjenige anzusehen hat, welches 
den Gleichungen ü möglichst genau genügt, für 
welches die betrachtete Funktion, wenn sie eine mit den 
ö immer wachsende ist, ihren kleinsten, wenn sie dagegen 
immer abnimmt, ihren grössten Wert erhält. Nennt man 
also diese Funktion F (dj, 02,...^«), so ist die Definition 
der Forderung des möglichst genau Genügens in der Beding- 
ung enthalten -n n^- n -ri hjt 
^ F — Mm. oder F « Max. 

Dieselbe ist denn auch in der That hinreichend, um das 
System der u zu finden, welches die geforderte Eigenschaft 
hat; denn da die d als Funktion der u zu betrachten sind, so 
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ist auch ^ Funktion derselben^ und die Bedingung des Maximum 
oder Minimum giebt 

welche m Gleichungen das System V repräsentieren. 

24. Die durch die betrachteten Eigenschaften charakterisierte 
Punktion F ist aber selbst noch unbekannt und es könnte 
möglich sein, dass diese Eigenschaften nicht bloss einer, sondern 
mehreren Funktionsformen zukämen. Wir brauchen uns jedoch 
in eine weitere Untersuchung hierüber nicht einzulassen, da 
noch eine wesentliche Bedingung zu einer völligen Bestimmung 
der Funktion F verhilft. Angenommen nämlich, das System 
U sei linear in Bezug auf die u, so wird sich notwendig die 
Forderung aufdrängen, dass auch das System V linear sei; 
denn es würde keinen Sinn haben, bei der näherungsweisen 
Auflösung linearer Gleichung mehrdeutige Resultate zu be- 
kommen. Man muss also auch annehmen, dass die Gleichungen 






vom ersten Grade seien für die u, also auch in Bezug auf 

dF 
die d; oder dass ^^ linear sei in Bezug auf die d. Die Funktion 

F selbst wird also eine symmetrische Funktion vom zweiten 
Grade in Bezug auf die d sein müssen, und da in derselben 
nur gerade Porenzen der d vorkommen können, so ergiebt 
sich für F notwendig der Ausdruck 

n 



F^a^S^+ß, 



worin a und ß willkürliche Konstanten bedeuten. Da nun 
diese Funktion eine immer zunehmende ist und sie ihren kleinsten 
Wert erhält, wenn 2Jd^^ Min. wird, so ist gemäss dem vorigen 
Paragraphen unter dem Systeme der w, welches den Gleich- 
ungen U möglichst genau genügt, dasjenige zu verstehen, 
welches « 
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macht. Die Gleichungen F, aus welchen dieses System u zu 
berechnen ist, ergeben sich: 

t =a 1 * 

oder, wenn man statt der d die ihnen gleichen Werte der 
U setzt: „ 

n-2'^'|§-o» &-1, 2,...».. 

Ist das System der U nicht linear, so bleibt es dennoch am 

dF 
einfachsten und natürlichsten, r-ir linear anzunehmen. Denn 

doi 

gesetzt, es seien die Gleichungen ü sämtlich vom ^*®" Grade^ 

so ist es erwünscht, dass auch die V vom p^^ Grade sind; 

ist aber -— ^ vom (» — 1)^^, so muss, wenn 

dUk vx- / 7 7 

dF 
vom p^^ Grade werden soll, ^-^ linear angenommen werden. 

Sind die U von verschiedenen Dimensionen in Beziehung 
auf die w, so werden bei obiger Annahme die V wenigstens 
nicht von höherer Dimension, als diejenige Gleichung unter 
den ?7, welche den höchsten Grad der u enthält. Wollte man 
jedoch diese Annahme nicht gelten lassen, so müsste man sich 
beschränken, das Verfahren als ein nur auf lineare Gleichungen 
anwendbares zu betrachten, und allerdings ist nur dieser Fall 
aus praktischen Gründen der allgemein behandelbare. 

Endlich ist noch zu berücksichtigen, dass möglicherweise 
gefordert werden kann, die Gleichungen U in verschiedener 
Weise genau zu erfüllen. Dann braucht man sich nur die- 
jenigen Gleichungen, welchen genauer genügt werden soll, 
mehrmals neben einander aufgestellt zu denken; die Zahl, wie 
viel Male man dieselbe Gleichung aufzustellen hat, giebt das 
Gewicht der Gleichung an. Dies kommt schliesslich darauf 
hinaus, jedes d* mit dem Gewichte ft zu multiplizieren, und 
somit erhält man die allgemeinere Bedingung: 



44 HI- Versuch der Begründung der Methode der kleinsten Quadrate 



» 



Xi [lidi^ r^ Min. 
und die Gleichungen V: 



n 



düi 



25. Diese Bedingung, welche den mathematischen Ausdruck 
der Forderung des möglichst nahe Liegens darbietet, enthält 
den Fundamentalsatz der Methode der kleinsten Quadrate, wenn 
man derselben eine allgemeinere Bedeutung als nur die eines 
praktisch notwendigen Hilfsmittels zur Ausgleichung von Be- 
obachtungen zuschreibt. Nach den vorangegangenen Betracht- 
ungen ist diese Methode das Mittel zur Lösung einer ganzen 
Klasse von Aufgaben, unter welche auch die der Ausgleichung 
gehört. Die Berechtigung zur Anwendung derselben gründete 
sich auf rein mathematische Voraussetzungen und Annahmen, 
die sich aus der Analyse des allgemeinen Problems selbst 
ergaben und die zwar Willkür enthielten, aber sich doch als 
die denkbar einfachsten darstellten. Man würde daher vielleicht 
nicht mit Unrecht den Fundamentalsatz, in dessen Anwendung 
die verallgemeinerte Methode der kleinsten Quadrate besteht, 
als ein Postulat bezeichnen können. 

Die allgemeinere Wichtigkeit, welche hiermit der Methode 
der kleinsten Quadrate vindiziert wird, rechtfertigt sich, wenn 
man die Analogien beachtet zwischen ihren Resultaten und 
bekannten Thatsachen der Mechanik und Physik. So kann 
man sie in Beziehung bringen mit dem Satze vom Parallelo- 
gramm der Kräfte; denn analog dem BegriflFe des Mittelpunktes 
zweier Punkte müsste man die Diagonale eines Parallelogramms 
als die Mittellinie der beiden Seitenlinien' bezeichnen, und 
man könnte füglich den genannten Satz einfach so aussprechen: 
Zwei Kräfte an einem Punkte können durch eine Kraft ersetzt 
werden, welche denselben nach Grösse und Richtung möglichst 
nahe liegt. — Längst bekannt und diskutiert ist femer die 
Beziehung zu den Eigenschaften des Schwerpunktes oder, all- 
gemeiner, des Mittelpunktes von Parallelkräften. — Das me- 
chanische Prinzip des kleinsten Zwanges ist nur der Ausdruck 
dafür, dass die Bewegungen eines unfreien Systems denjenigen. 
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welche eintreten würden, wenn das System frei wäre, möglichst 
nahe liegen. — Ebenso könnten uns einige der wichtigsten 
Hauptsätze der Physik glauben machen, als habe die Natur 
in diesen Fällen Aufgaben des möglichst nahe Liegens gelöst; 
so würde man z. B. die Wege, die ein reflektierter oder ein 
gebrochener Lichtstrahl beschreibt, unter der Voraussetzung,, 
dass diese indirekten Wege den direkten wenigstens möglichst 
nahe liegen, durch die Methode der kleinsten Quadrate ebenso 
finden, als sie sich durch Beobachtungen oder andere Theorien 
unzweifelhaft ergeben haben. 

Durch solche Betrachtungen könnte man sogar auf den 
Gedanken geführt werden, ob nicht den Gesetzen der Natur, 
die wir beobachtend und rechnend zu erforschen trachten, 
ein Hauptprinzip zu Grunde liege, das etwa so auszusprechen 
wäre: Die durch äussere Einflüsse bewirkten Veränderungen 
geschehen stets so, dass die veränderten Zustände denjenigen, 
aus welchen sie hervorgegangen, immer möglichst nahe liegen 
— und dass man als mathematischen Ausdruck dieses Prinzips ^) 
den Fundamentalsatz der Methode der kleinsten Quadrate zu 
betrachten habe. — Es kann hier nicht der Ort sein, weitere 
Untersuchungen darüber anzustellen, ob dieser Gedanke so 
allgemein berechtigt sei und inwiefern er sich überhaupt frucht- 
bar erweisen könne. 

26. Um zu zeigen, wie man durch das gewonnene Prinzip 
in den Stand gesetzt ist, spezielle Aufgaben zu lösen, betrachte 
ich zuerst die verallgemeinerte Lambertsche Aufgabe: es sind 
in einer Ebene n Punkte x^y^, x^y%y •-- XnVn gegeben, man 
sucht die spezielle Kurve von der Gleichung y = fXj welche 
diesen Punkten möglichst nahe liegt. Analytisch betrachtet 
würde man dann die Aufgabe haben: es sind die m Konstanten 
der Funktion f so zu bestimmen, dass die n Gleichungen 
zwischen den gegebenen Grössen x^y^yX^y^ .,.Xnyn',^> ^ 

möglichst genau erfüllt werden. In diesem Falle ist nach der 
früheren Bezeichnung 



1) Dasselbe wäre gewissermassen ein verallgemeinertes Trägheits- 
gesetz. 
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di — fXi — yi 
und man erhalt also die Bedingung 

n 

Nennt man die Eonstanten der Funktion f c-t.c^. .,,Cm, so be- 
stimmen sich dieselben aus den m Gleichungen 

Ein besonderes Interesse gewährt der Fall, wo man sich die 
Punkte in einer kontinuierlichen Folge gegeben denkt, also 
z. B. liegend auf einem Stücke einer Kurve y =» Fx. Dann 
entsteht die Aufgabe, eine Kurve von bekannter Form einer 
gegebenen Kurve auf einer gewissen Strecke, z. B. zwischen 
den Abscissen a^ und a^ möglichst nahe zu bringen oder eine 
Funktion innerhalb eines gewissen Intervalles der unabhängigen 
Variabein möglichst genau durch eine andere Funktionsform 
auszudrücken. Die vorher erhaltene Bedingung geht dann 
über in 

Bei der Bestimmung dieses Grenzwertes macht allein das 
Gewicht einige Schwierigkeit. Wollte man allen unendlich 
vielen Punkten ein endliches Gewicht beilegen, so würde die 
Summe von allen Gewichten 

nnendlich gross werden; da aber durch die kontinuierliche Folge 
der Punkte nur ein endliches Gebilde, nämlich ein Kurven- 
stück, entsteht, so wird man das Gesamtgewicht immer noch 
als eine endliche Grösse zu betrachten haben imd demzufolge 
den einzelnen Punkten für sich ein imendlich kleines Gewicht 
zuschreiben müssen^). Dadurch wird am Begriffe des Gewichts 
nichts geändert, denn es ist erlaubt, die sämtlichen Gewichts- 
zahlen durch eine beliebige Grösse, die also auch unendlich 
gross genommen werden kann, zu dividieren. Neimt man 



1) Es ist das ganz analog dem Übergange von einem System 
-diskreter Massenpunkte zu einem Körper. 



"■« ■"«•X ^n ^1 
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also das Gewicht eines Punktes ^x nnd das Gesami^ewicht 
aller Punkte , wenn sie alle das nämliche Gewicht hätten^ 
M., so ist j^^ j^^ 

W Xn — fl/i W 

und beim Übergange zur Grenze wird 

Limn^coiix^ dMx*^ '^— dx. 

Ändert sich nun das Gewicht kontinuierlich von Punkt zu 

M 

Punkt, so ist Mx und also auch — eine Funktion von xi 

bezdchnet man dieselbe mit Ox^ so ist endlich 

Limn^w lUx^ ^x . dx. 

Dies eingesetzt geht der zu bestimmende Summengrenzwert 
über in ein bestimmtes Integral, und man erhält: 

«4 



/c 



{fx — Fxf 0x dx = Min,, 

woraus sich die Konstanten c^, c^, . . . c^ der Funktion f (unter 
der Voraussetzung natürlich, dass die Gewichtsfunktion O von 
denselben unabhängig ist) durch die m Gleichimgen: 



I (fx-Fx) ^^xdx^O, Ä; - 1, 2, . • . 



m 



«1 
bestimmen. 

Weiter behandelbar ist im allgemeinen nur der spezielle 
Fall, wo diese Gleichungen linear werden in Bezug auf die c\ 
dieser tritt ein, wenn f selbst linear, also von der Form ist: 

in welchem Ausdruck die Funktionen qp die c nicht enthalten. 
Wendet man dann die abgekürzten Bezeichnungen an: 

q>hX . (pkX .Oxdx^ Pa, t, / q)hX . Fx .Qxäx^ Qk, 

«I o, 

so bestimmen sich die c aus dem Gleichungssystem: 

Po , * + Ci Pi, i 4- Cj P2 , * + . . . + Cm Pm , * — ^* , fc = 1 , 2 , . . . W. 
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Vorauszusetzen ist dabei selbstverständlich^ dass die Integrale 
in dem angenommenen Intervalle einen bestimmten, endHchen 
und reellen Wert behalten, denn wäre dies nicht der Fall, so 
würde es ein Zeichen dafür sein, dass sich die Aufgabe in 
der gegebenen Form überhaupt nicht lösen lässt. 

27. Von dem eben erhaltenen Satze giebt es einige be- 
sonders interessante Spezialitäten. Wird z. B. verlangt, eine 
Funktion F innerhalb des Intervalles a; ~ bis ä = a, in dem 
dieselbe endlich und stetig bleiben muss, auszudrücken durch 
die Funktion: 

SO ist ZU setzen, wenn man der Einfachheit wegen 0x kon- 
stant und gleich 1 annimmt: 

fPoX^O, (pkX'^oi^^y 



a 





und das Gleichungssystem zur Bestimmung der c lautet dem- 
nach: 

a 


Tc^lj 2, . . . m. 

Nimmt man m immer grösser, so gelangt man schliesslich zu 
der Aufgabe, die Funktion F durch eine unendliche Potenz- 
reihe auszudrücken. Ist dies in dem Intervalle bis a über- 
haupt möglich, so sind die Werte der c schon bekannt; nacli 
dem Theorem von Mac Laurin ist nämlich 

also 1- ^• 

jp(*-i)0 

Demnach muss für jeden Wert für k von 1 bis oo die Gleichong 
erfüllt sein: ^ 

1 „^ , a FO , a* F"0 , . /\_, „ , 
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Dieselbe ist in der That leicht zu verifizieren. Augenschein- 
lich existiert also ein Zusammenhang zwischen den Resultaten 
der Methode der kleinsten Quadrate und den Theoremen von 
Taylor und Mac Laurin. 

Noch eine andere Annahme führt auf interessante Fol- 
gerungen. Gesetzt, es würde verlangt, die Funktion F in 
dem Intervalle x ^0 bis x^^ n darzustellen durch 

fx'^ c^ + C2COSX + c^cos2x + ,..+ CmCOS{m—\) Xf 

so wäre zu setzen: 

q)QX — 0, q)kX — cos (&— 1) X, 

und wenn man wieder <2ia; «= 1 annimmt: 



h,k 



n 



0, für Ä^Ä, /- 

^TCy „ A — Ä>1, Qk^ I Fxcos(]c—l)xdx. 

Durch diese speziellen Werte gestalten sich die Gleichungen 
far die c sehr einfach und es ergiebt sich aus ihnen: 

71 fl * 

Cj — — / Fx dXj cjfc = — / Fx cps (k—l) x dx. 



Diese Entwickelung ist stets möglich, so lange Fx in dem 
Intervalle bis tc endlich und stetig bleibt, und zwar wie 
gross auch Ä;, also m genommen wird. Lässt man also m 
unendlich werden, so erhält man den Satz: Ist Fx endlich 
und stetig von ic — bis a; « jr, so kann man Fx in diesem 
Intervalle darstellen durch die unendliche Reihe: 

Fx ^\Aq + A-^^cosx + Ä^cos2x + .. ,j 
wenn man 

n 

2 /* 
.4a — — 1 Fu cos hu du 



-iß 



nimmt. Dieser Satz ist aber ein Spezialfall des Theorems 
von Fourier, und somit ist abermals ein Zusammenhang der 
aus der Methode der kleinsten Quadrate gefolgerten mit schon 
anderweitig bekannten Resultaten nachgewiesen. 

28. In den bisher betrachteten Beispielen ist die Gewichts- 
funktion als konstant und gleich 1 angenommen worden, 

Henke, Methode der kleinsten Quadrate. 2. Aufl. 4 
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d. h. man hat verlangt, dass die Funktion F durch f in 
dem bestimmten Intetralle überall gleich genau ausgedrückt 
werde. Man kann sich aber auch die Forderung gestellt 
denken, dass sich die Werte von f denen von F an gewissen 
Stellen des Intervalles mehr nähern sollen als an anderen; 
dann hat man der Funktion O eine dementsprechende Form 
zu geben. 

Um dies an einem Beispiele zu zeigen, will ich annehmen, 
es solle y\ + x^ in dem Intervalle x^O bis x^l möglichst 
genau dargestellt werden durch einen Ausdruck von der 
Form A + Bx^)^ welche Aufgabe, geometrisch gefasst, be- 
sagen würde: das Stück einer gleichseitigen Hyperbel, welches 
zwischen den Abscissen a; — und x^\ liegt, in möglichste 
Übereinstimmung zu bringen mit einer Geraden. Verlangt 
man nun dabei, die Übereinstimmung solle in ihrer Genauig- 
keit von o; — bis o; «» 1 stetig abnehmen, so genügt man 
dieser Forderung am einfachsten, indem man der Funktion ^ 
die Form giebt: 

OX « :r-, , 

WO p eine beliebig grosse positive Zahl bedeutet, die um so 
grösser zu nehmen ist, je rascher die Abnahme der Genauig- 
keit stattfinden soll. Oder man könnte auch eine solche Form 
wählen, die gleichzeitig die vorkommenden Integrale P und Q 
möglichst einfach macht. So erhält man denn in diesem Falle, 
wenn man die Zahlenrechnungen ausführt: 



für Oa:-!, j/l + rc^ « 0,93432 + 0,42695 er, 

n *^ - TA ."^' yr+^' -- 0,93789 + 0,41861 x, 



„ ^^""f+p^ l/l + a:* = 0,94116 + 0,40999a;, 

1 

'' 1 + lQOx ^ }/l + ic^-0,99432-f 0,26477 a:, 



1) Eine Lösung dieses Problems für praktische Zwecke und von ganz 
tmderen Gesichtspunkten gab zuerst Poncelet, Sur Ja vdleur approchee 
UHcairt et ratiom^le des radieaux de ?a forme > a*+b*, ] a*— b* etc. 
Orelle's Journal Bd. 13 S, 277. 
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aus welchem Täfelchen die Änderung der Genauigkeit zu er- 
sehen ist, welche den verschiedenen Formen der Gewichts- 
funktion entspricht. 

29. Bei der Anwendung der Methode der kleinsten Quadrate 
auf die Aufgaben des möglichst nahe Liegens kommt es darauf 
an, wie man die Gleichungen TJ aufzustellen und welche 
Grössen man demgemäss als die Differenzen 8 einzuführen 
habe. Im allgemeinen lässt sich hierüber nichts sagen, ich 
will nur einige spezielle Andeutungen geben. Hat man z. B. 
die Aufgabe, eine Fläche 0^F{Xy y) solle einer andern z «= fix^y) 
von bekannter Gleichungsform möglichst nahe gebracht werden, 
so kann die Übereinstimmung bloss innerhalb eines geschlossenen 
Flächenstückes geschehen, welches man irgendwie festzulegen 
hat, z. B. dadurch, dass man in der rry-Ebene eine geschlossene 
Kurve y ^^ (px zieht und auf derselben eine senkrechte Cylinder- 
fläche errichtet. Die Übereinstimmung hat dann stattzufinden 
für alle Punkte der beiden Flächen, welche innerhalb dieser 
Cylinderfläche liegen, und die 8 sind die Differenzen der den- 
selben Werten von x und y zugehörigen verschiedenen Werte 
der z. Die Quadrate dieser Differenzen sind zu summieren in 
Bezug auf alle x und alle y; man erhält also ein Doppel- 
integral, dessen Grenzen sich ergeben aus der Gleichung y «= (px. 
Da man endlich auch das Gewicht als Funktion sowohl von x, 
als von y anzunehmen hat, so ergiebt sich die Bedingung: 



// 



[f{x^y) — F{x,y)Y ^ (x,y) dx dy ^Min. 



«1 yi 
Es steht aber auch frei, die Begrenzung der Flächenstücke 
auf eine andere Weise zu bestimmen, gerade so, wie man in 
der Ebene statt der Kurvenstücke, die zwischen zwei Ordinaten 
liegen, auch die, welche innerhalb zweier Radienvektoren ent- 
halten sind, einander möglichst nahe bringen könnte. In jedem 
Falle ändern sich dann die Differenzen 8 in entsprechender 
Weise um. 

Nimmt man ferner an, es seien zwei Kurvenstücke y^F^x 
und y — i^2^ gegeben, z.B. begrenzt durch zwei Ordinaten, 
die zu den Abscissen a^ und «2 gehören, so wird es erlaubt 
sein, ähnlich wie man von einem Mittelpunkte zweier Punkte 

4* 
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spricht, von einer Mittellinie zu reden. Man würde dieselbe 
definieren können als den geometrischen Ort der Mittelpunkte 
je zweier zu demselben x gehörigen Punkte; ihre Gleichung 
wäre also unter Voraussetzung gleichen Gewichtes 

y - i {F^x + F^x). 

Verlangt man nun, dass eine Kurve von bekannter Gleichungs- 
form y rmmfx den beiden Kurvenstücken J\ und F^ möglichst 
nahe Uegen soll, so kann man hier in ähnlicher Weise, wie 
bei der Betrachtung des Mittelpunktes, das assoziative Prinzip 
anwenden^) und sich die beiden Kurvenstücke ersetzt denken 
durch ihre Mittellinie. Dann ist diese Aufgabe zurückgeführt 
auf die einfachere, wo nur zwei Kurvenstücke in möglichste 
Übereinstimmung zu bringen sind. Den BegriflF der Mittel- 
linie kann man verallgemeinem, wenn man annimmt, dass 
auf die Bestimmung derselben J?\ und F^ einen ungleichen 
Einfluss haben sollen. Bezeichnet man nun mit O^^x und ^^x 
die Gewichtsfunktionen der Kurven F^ und F^ in Beziehui^ 
auf ihre Mittellinie, und mit Ox diejenige, welche ausdrückt, 
wie genau die Kurve f mit der Mittellinie von F^ und F^ in 
Übereinstimmung gebracht werden soll, so ergiebt sich zur 
Lösung der allgemeineren Aufgabe die Bedingung: 

Ol 

In gleicher Weise kann man die Aufgaben immer mehr kom- 
plizieren. — Schliesslich ist noch zu erwähnen, dass man schon 
früher die Methode der kleinsten Quadrate auf das Problem 
der Interpolation^) angewandt hat; durch unsere Verall- 
gemeinerung der Methode wird an der Lösung dieser Aufgabe 
des möglichst nahe Liegens nichts geändert. 

1) Vergl. oben S. 34 Note 1. 

2) Ausser den schon S. 26 Note 3 zitierten Aufsätzen von Cauchy 
und Bienaym^ im 37. Bande der Comptes rendtis sind hier noch an- 
zuführen: Tch^bychef, Sur les fraetions continues, Liouville^s Jour- 
nal Ilieme ßSrie, Tome 111, 1656; Sur Vinterpolation par la methode 
des moindres carris, Mim. de VAcad. de St. Pitershourg Vll*«me Serie, 
Tonte I, 1859; Borchardt, Über eine Interpolationsformel für eine 
Art symmetrischer Funktionen und deren Anwendung, Abhandlungen 
der Berliner Akademie der Wissenschaften vom Jahre 1860. 
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30. Es bleibt zuletzt noch übrig, die praktisch wichtigste 
AnwenduDg der Methode der kleinsten Quadrate, nämlich die 
zur Ausgleichung von Beobachtungen, näher zu betrachten, 
um zu sehen, wie sich die Resultate der verallgemeinerten 
Methode zu den schon bekannten Resultaten der speziellereh 
Yerhalten. Die vorliegende Aufgabe ist folgende : n Beobachtungs- 
resultate liefern für m Unbekannte Wi, Wg, . . . W;,^, m < w, Gleich- 
ungen 

f7i«0, ^2 = 0,... ün-0, 

woraus sich also die u nicht streng bestimmen lassen; man 
kann nur fragen nach denjenigen Werten der m, welche 
sämthchen Gleichungen möglichst genau genügen. Die Ant- 
wort auf diese Frage erhält man aber durch Anwendung der 
Methode der kleinsten Quadrate. Somit wäre die Aufgabe 
der Ausgleichungsrechnung als völlig erledigt zu betrachten, 
wenn dieselbe nicht noch eine andere Deutung zuliesse. Da 
man nämlich im allgemeinen alle Beobaohtungsresultate mit 
unvermeidlichen Fehlem behaftet weiss, und man sich diese 
Resultate daher nicht als festbestimmte, sondern als zwischen 
gewissen Grenzen hin- und herschwankende Grössen zu denken 
hat, so kann es schon deswegen nicht möglich sein, für die 
Unbekannten die wahren Werte zu ermitteln; bei diesen 
gewissermassen im Flusse befindlichen Verhältnissen tritt 
2iher an Stelle der Gewissheit die mathematische Wahr- 
scheinlichkeit. Denn man sagt sich, bei dem Bewusst- 
sein grösstmöglicher Sorgfalt, dass nicht alle Fehlergrössen 
gleich wahrscheinlich sein werden, dass bei- einem System 
von Beobachtungsresultaten ein gewisses System von Fehlem 
als das wahrscheinlichste vorausgesetzt werden könne und 
dass gerade diesem Systeme Werte der Unbekannten 
entsprechen werden, die als die wahrscheinlichsten zu 
betrachten sind. Wie bekannt, gleicht die aus gewissen 
Voraussetzungen über die Wahrscheinlichkeit der Fehler 
erhaltene Methode der kleinsten Quadrate die Beobachtungs- 
resultate so aus, dass sie für die Unbekannten die wahr- 
scheinlichsten Werte liefert. Da nun die verallgemeinerte 
Methode der kleinsten Quadrate ihrem Sinne nach nicht wahr- 
scheinlichste Werte giebt, so fragt es sich, unter welchen 
Voraussetzungen sind die Resultate derselben zugleich die 
wahrscheinlichsten? 
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31. Man kann die relative Wahrscheinlichkeit eines Fehlers 
X betrachten als eine Funktion (px desselben, und wenn man 
sich diese Funktion als Gleichung einer Kurve denkt, so ist 
es möglich, unter gewissen Voraussetzungen sich ein Bild 
von dem Laufe dieser sogenannten Wahrscheinlichkeits- 
kurve zu machen. Dieselbe liegt bekanntlich ganz auf der 
positiven Seite der Abscissenachse, hat ein Maximum bei x^Q 
und fällt von der Ordinatenachse, nach beiden Seiten symmetrisch, 
erst sehr langsam, von gewissen Punkten aber, die zugleich 
Wendepunkte sind, sehr rasch gegen die ir- Achse ab und 
nähert sich derselben asymptotisch. Der Flächeninhalt der 
gesamten Kurve ist: 



/ €px dx ^2 I q)xdx ^1. 
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Die angeführten Eigenschaften reichen aber nicht hin, um 
analytisch die noch unbekannte Form der Funktion g? oder 
die Gleichung der Wahrscheinlichkeitskurve zu bestimmen; man 
wird sich damit begnügen müssen, eine solche Fonn zu kon- 
struieren, so zwar, dass sie die verlangten Eigenschaften 
hat. Da man nun, wenn es etwa mehrere solcher Formen 
geben sollte, von allen die einfachste auswählen würde, so 
liegt es nahe, zuerst nachzusehen, ob nicht eine der ein- 
fachsten Funktionsformen, welche die Analysis überhaupt kennt, 
für diesen vorliegenden Zweck passend ist oder passend gemacht 
werden kann. la der That ist dies der Fall; den Anforderungen 
genügt eine Exponentialgrösse 

wo A und h noch zu bestimmende Konstanten sind. Es nimmt 

diese Funktion von dem Maximalwerte A bis zu iP =« + ^rr 

langsam ab; die Konstante h bestimmt sich also durch die 
vorausgesetzte Genauigkeit: je grösser diese, desto grösser muss 
auch h genommen werden^). Die andere Konstante J, welche 
den Wert der Funktion für x =^0 repräsentiert, ergiebt sich 
aus der Bedingung: 



1) Gauss nennt daher diese Grösse das Genauigkeitsmaß. 
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I g)xdx^ I Äer^*'^ dx^l 
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Hiemach kann man der Funktion der relativen Wahrschein- 
lichkeit eines Fehlers x die Form geben: 



y~7C 



(px ^ —= C"***\ 



32. Diese Art und Weise, zu der jetzt allgemein an- 
genommenen Form der Wahrscheinlichkeitstransscendente zu 
gelangen, ist eine rein empirische Konstruktion. Sie giebt da- 
her nicht etwa einen notwendigen Zusaromenhang zwischen 
den Grössen der Fehler und ihren Wahrscheinlichkeiten; ein 
solcher ist uns vielmehr; wenn er überhaupt existiert, wegen 
mangelnder Einsicht in die innere Natur der Fehler und den 
Mechanismus der Beobachtungen noch verborgen, und wenn 
man auch voraussetzen darf, dass die angenommene Funktions- 
form mit dieser idealen Form des Zusammenhanges, wenigstens 
in den bis jetzt erkannten und beobachteten Eigenschaften, 
in einer für die Praxis genügenden Übereinstimmung steht, 
so ist doch das Gesetz, welches sie repräsentiert, nur als ein 
Erfahrungsgesetz zu betrachten. 

Statt die Funktion €p rein empirisch abzuleiten, welches 
jedoch der naturgemässeste und, streng genommen, einzig be- 
rechtigte Weg ist, kann man auch rechnend zu ihr gelangen 
mit gewissen Annahmen. Dies thut Gooss^), oder man kann 
seine Darstellung wenigstens in diesem Sinne umändern. Aus 
den Eigenschaften der Wahrscheinlichkeitskurve, für x ^ 
ein Maximum zu haben, dann abzunehmen und bei aJ — ± c 
Wendepunkte zu besitzen, folgt, dass die beiden ersten Diffe- 
rentialquotienten der Wahrscheinlichkeitsfanktion q) unter den 
Formen erscheinen müssen: 

g)^x — — xg)^Xy q)^^x «= (c*— x^) 92^; 

wobei €p^x und cp^x weder x noch (?—o? als Faktoren ent- 
halten dürfen, sonst aber völlig willkürliche Funktionen sein 

1) Vergl. oben § 12, S. 23. 
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können. Wären die Formen derselben bekannt, so würde 
sich g)X ergeben aus der Differentialgleichung: 

€p"x c*— aj* g)^x 

fp' X X g)iX 

Da es aber nur darauf ankommen kann, fiir cp die möglichst 
einfiache Form zu erhalten, so wird es gestattet sein, cp^ und 
g?2 so zu wählen, dass diese Differentialgleichung die mög- 
lichst einfache Gestalt annimmt, und also: 



<p^x 



-« (Jonst = A 



(p^x 
zu setzen. Integriert man nun die Differentialgleichung 

q)"x . <?--x^ 

(p^ X x 

und bestimmt die Integrationskonstanten, sowie auch die Kon- 
stante A gemäss den übrigen Eigenschaften von 9, so erhält 
man schliesslich: x* 

q)X=-—;= — e : 

und wenn man hierin noch ö"!"*^^ setzt, so nimmt q>x ganz 
die gebräuchliche Form an: 

33. Betrachtet man diese Transscendente als die plausibelste 
Form der Wahrscheinlichkeitsfimktion der Fehler, so kann 
man nach den Prinzipien der WahrscheinKchkeitsrechnung 
aus den Beobachtungsresultaten die wahrscheinlichsten Werte 
der Unbekannten finden. Dabei kommt man auf dieselben 
Resultate, welche die Anwendung der Methode der kleinsten 
Quadrate (im verallgemeinerten Sinne) liefern würde, wenn 
man als die Differenzen ö die Beobachtungsfehler und als die 
Gewichte der Beobachtungen die Grössen A* betrachtet. Man 
erhält also den Satz: Wenn man über die Wahrscheinlichkeit 
der Fehler solche Voraussetzungen zu machen berechtigt ist, 
dass als der plausibelste mathematische Ausdruck derselben 
jene Transscendente angenommen werden darf, so sind die- 
jenigen Werte der Unbekannten, die man aus den Beobachtungs- 
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resultaten durch die Methode der kleinsten Quadrate (im ver- 
allgemeinerten Sinne) erhält, zugleich die wahrschein- 
lichsten Werte derselben. — Giebt es jedoch Fälle, wo 
jene Voraussetzungen nicht statthaben können, oder wo man 
zweifelhaft ist, ob jene angenommene Form der Wahrschein- 
lichkeitsfunktion die passendste sei, so haben dann allerdings 
die Resultate der Methode der kleinsten Quadrate nur die Be- 
deutung als Werte, welche den Beobachtungsresultaten mög- 
hchst genau entsprechen, oder kurzweg als Mittelwerte. 
In diesen Fällen wird man jedoch auf die Ermittelung der 
wahrscheinlichsten Werte ganz verzichten müssen; denn könnte 
man auch eine andere passendere Funktionsform ausfindig 
machen, so würden doch die Bedingungsgleichungen dafür, 
dass die betreffenden Werte der Unbekannten die wahrschein- 
hchsten Fehlergrössen übrig lassen, d. h. dafür, dass, wenn 
a;.,a^,...a:, die Fehler sind, 

(px^ . q)X2-'. q)Xn = Max, 

werde, nicht mehr linear bleiben. 

In Bezug auf die Zulässigkeit jener Voraussetzungen über 
die Wahrscheinlichkeit der Fehler schwebt man stets in Un- 
sicherheit, aber dennoch ist man genötigt, in allen Fällen 
die Methode der kleinsten Quadrate anzuwenden; daher wird 
es gerechtfertigt sein, auf die Benutzung von Wahrscheinlich- 
keitsprinzipien zur Ausgleichung von Beobachttmgen einen so 
hohen Wert überhaupt nicht zu legen, sondern sich damit 
zu begnügen, dieses Problem als eine Aufgabe des möglichst 
nahe Liegens anzusehen, und demgemäss durch dia Methode 
der kleinsten Quadrate im verallgemeinerten Sinne für die 
Unbekannten aus den Beobachtungsresultaten Mittelwerte 
zu erhalten. Damit ist dem praktischen Interesse vollkommen 
genügt, während weitergehenden Untersuchungen, welche sich 
auf Wahrscheinlichkeitsbegriflfe stützen, immer noch ein all- 
gemein wissenschaftlicher Wert verbleibt. 



Zusätze. 



IV. 



Die Methode der kleinsten Qnadrate nnd das 

Gansssche Fehlergesetz. 



34. Aus der Geschichte der Wahrscheinlichkeitsrechnung 
ist hekannt, dass die Begründer dieser Disziplin Pascal und 
Permat (in ihrem Briefwechsel 1654) zuerst eine mathematische 
Behandlung der Zufallsspiele unternommen hahen. Auch 
Jacob Bernoulli suchte in der Ars conjectandi (nach dem 
Tode des Verfassers 1713 erschienen) zunächst die Berechnung 
der Wahrscheinhchkeiten bei den Hazardspielen durchzuführen, 
wo dies a priori möglich ist. Ihm blieb jedoch nicht ver- 
borgen, dass auch andere Ereignisse, deren Eintreffen von 
einer grösseren Zahl von Ursachen, die mehr oder weniger 
sicher bekannt sind, abhängt, eine gewisse Analogie mit Zu- 
fallsspielen darbieten, und dass sich demgemäss von einer mathe- 
matischen Wahrscheinlichkeit ihres Eintreffens sprechen lässt, 
die aber nur a posteriori zu bestimmen ist. Das typische Bei- 
spiel für den Unterschied der beiden Arten der Wahrschein- 
lichkeit bietet das Zufallsspiel, aus einem Gefäss mit schwarzen 
und weissen Kugeln eine derselben herauszugreifen. Ist die 
Anzahl der schwarzen und die der weissen Kugeln genau 
bekannt, so lässt sich, unter gewissen Voraussetzungen, die 
Wahrscheinlichkeit, etwa eine schwarze zu ziehen, a priori 
bestimmen. Ist dagegen das Mischungsverhältnis unbekannt, 
so kann dieselbe Wahrscheinlichkeit nur a posteriori^ nämlich 
aus einer grossen Zahl von Versuchen gefunden werden und 
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zwar um so genauer, je grösser diese Zahl ist. Durch diese 
grosse Zahl von Versuchen kann auf das unbekannte 
Mischungsverhältnis geschlossen werden und man kann an- 
nehmen, dass bei jedem neuen Griff in das Gefäss die 
Wahrscheinlichkeit, eine schwarze Kugel zu ziehen, annähernd 
diejenige ist, die sich durch das gefundene Mischungsverhält- 
nis nunmehr a priori bestimmen würde. 

Seit den grundlegenden Untersuchungen von Jacob Ber- 
noulli hat man nun bei Ereignissen aus den verschiedensten 
Gebieten in der Natur, der Wissenschaft und des menschlichen 
Lebens den Begriff der Wahrscheinlichkeit a posteriori an- 
gewendet. Massgebend fiir diese Anwendung ist die rein äusser- 
hche Analogie mit dem Zufallsspiele, dass uns bei allen diesen 
Ereignissen das — wenn ich so sagen darf — Mischungs- 
verhältnis der vielen und verschiedenartigen Ursachen, die das 
Eiutreffen des Ereignisses zur Folge haben, unbekannt ist. So 
spricht man nicht nur von der Wahrscheinlichkeit, dass einem 
Beobachtungsresultat ein Fehler von bestimmter Grösse anhafte^ 
oder von der Wahrscheinlichkeit, dass ein Mensch im Laufe 
des nächsten Jahres sterben oder ein Verbrechen begehen werde, 
dass er, von einer Krankheit befallen, geheilt werde; sondern 
man hat auch die Wahrscheinlichkeit der richterlichen Urteile 
und der Zeugenaussagen der mathematischen Behandlung unter- 
worfen, ja man hat sogar die Wahrscheinlichkeit berechnet, 
dass am nächsten Tage die Sonne aufgehen werde. Die für 
die vorliegende Betrachtung wichtigste Anwendung des Wahr- 
scheinlichkeitsbegriffs ist die, welche Gauss auf die Theorie 
der Beobachtungsfehler gemacht hat. Li sinnreicher Weise 
verwertet er den von Laplace gegebenen Vergleich der Be- 
obachtung mit einem Zufallsspiele^). Er erhält für die Wahr- 
scheinlichkeit, einen Fehler von bestimmter Grösse zu begehen, 
eine — ihrer Natur nach durchaus empirische — Formel, da» 
berühmte nach ihm genannte Fehlergesetz. Durch dasselbe kann 
nach den Regeln der Wahrscheinlichkeitsrechnung die Methode 
der kleinsten Quadrate begründet werden. 

35. In neuester Zeit ist die Anwendbarkeit der Wahr- 
scheiolichkeitsprinzipien auf verschiedene Erscheioungsreihen, 



1) Vergl. 0. S. 11. 
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nicht nur vom mathematischen, sondern auch vom logischen 
Standpunkte aus kritisch untersucht worden. Namentlich hat 
man sich bestrebt, die Bedingungen festzustellen, unter denen 
dem subjektiven logisch -mathematischen Begriff der Wahr- 
scheinlichkeit eine objektive Bedeutung zuzuschreiben ist. Das 
machte die Untersuchung nötig, inwieweit jene Erscheinungs- 
reihen analog einem Zufallsspiele verlaufen. Denkt man wieder 
an das oben angeführte typische Beispiel eines solchen, so 
muss man dabei als sicher annehmen, dass das unbekannte 
Mischungsverhältnis konstant bleibt und dass vor jedem Zug 
die Kugeln in gleicher Art gemischt erscheinen. Da hat sich 
denn herausgestellt, dass diese Analogie nur in den seltensten 
Fällen als unbedingt feststehend behauptet werden kann und 
dass daher in den meisten Fällen nur mit grösster Vorsicht 
dem Wahrscheinlichkeitsbegrifif eine objektive Bedeutung bei- 
gelegt werden darf. Durch diese Untersuchungen sind Mein- 
ungen, die früher unbestrittene Geltung hatten, als unhaltbar 
nachgewiesen oder wenigstens stark erschüttert worden. 

Cantor^) warnt vor einem zu weit gehenden Vertrauen 
in die reale Giltigkeit von Resultaten der Wahrscheinlichkeits- 
rechnung und fordert in jedem Falle ihrer Anwendung strenge 
Kritik. Er sagt^): „Die Mathematiker beschränken sich freilich 
in den meisten Fällen bei der Herleitung der Grundbegriffe, 
wie mathematische Wahrscheinlichkeit, möglicher 
Fall, Gewissheit und dergl., auf synthetische Begriffs- 
erklärungen, die Bedingungen ihrer Anwendbarkeit werden 
oft als etwas Selbstverständliches nicht weiter erörtert; um die 
fundamentalen Sätze wie z. B. deai für die Wahrscheinlichkeit 
zusammengesetzter Ereignisse zu beweisen, wird ein konkreter 
Fall, wie etwa der einer Urne mit schwarzen und weissen 
Kugeln behandelt; und es wird manchmal stillschweigend die 
Richtigkeit derartiger Sätze auf Fälle übertragen, in welchen 
ihre Giltigkeit mindestens zweifelhaft ist. — „Nirgends ist die 
Gelegenheit in dem Grade vorhanden, wie hier, die Kunst der 
Analysis in glänzender Weise zu entfalten; aber auch nirgends 
tritt der Fall häufiger auf, dass die mit Scharfsinn durch- 



1) Cantor, Historische Notizen über die Wahrscheinlichkeitsrech- 
nung. Halle 1874. 

2) A. a. 0. S. 7 flg. 
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gefahrte Rechnimg von gar keinem Werte ist, weil sie sich 
auf unrichtige Yoraussetznngen stützt. 

Die Wahrscheinlichkeitsrechnung hat also stets und be- 
sonders, wenn ihr ein neues Feld der Anwendung gegeben 
wird, eine Erörterung notig, worin die Gütigkeit ihrer Be- 
rechnungen genau festgestellt wird." 

Von hervorragender Bedeutung sind die ausgedehnten 
kritischen Untersuchungen von Lexis^) über die Anwendbar- 
keit des WahrscheinUchkeitsbegriffs auf die statistischen B>eihen^ 
die zur Darstellung von Massenerscheinungen der menschlichen 
Gesellschaft dienen. Durch dieselben sind die übertriebenen 
Vorstellungen, die man — hauptsächlich der Auffassung von 
Qu^telet folgend — von der Konstanz der Wahrscheinlich- 
keit für das Eintreffen gewisser Ereignisse zu haben pflegte^ 
auf ein ziemlich bescheidenes Maß zurückgeführt worden. Aus 
der Definition der mathematischen Wahrscheinlichkeit geht her- 
vor, dass sie nur Bedeutung haben kann für gleich mögliche 
und von einander unabhängige Einzelereignisse, wie sie bei 
einem Zufallsspiele subjektiv angenommen werden können. 
Die Anwendbarkeit dieses Begriffes auf Massenerscheinungen 
steht keineswegs in dem landläufigen Sinne von vornherein 
fest, sondern kann nur auf Grund mühsamer Vergleichung der 
Theorie mit der Erfahrung erwiesen werden. 

Am ausführlichsten und eingehendsten ist die Kritik, die 
von Kries*) vom logischen Standpunkte aus an den Prinzipien 
der Wahrscheinlichkeitsrechnung übt. Er erörtert aber nicht 
nur ihre Pundamentalbegriffe, sondern prüft auch die objektive 
Bedeutung ihrer Resultate auf allen Gebieten, in denen die 
Anwendbarkeit der Prinzipien der Wahrscheinlichkeit gewöhn- 
lich als ohne weiteres zulässig angenommen zu werden pflegte. 
Diese kritische Untersuchung hat ebenfalls als Ergebnis eine 
Berichtigung vielfacher irriger Meinungen und eine Einschränkung 
des absoluten Vertrauens auf Folgerungen aus den Wahrschein- 
lichkeitszahlen. 



1) Lexis, Zur Theorie der Massenerscheinungen in der mensch- 
lichen Gesellschaft. Freiburg i. B. 1877. 

2) von Kries, Die Prinzipien der Wahrscheinlichkeitsrechnung. 
Eine logische Untersuchung. Freiburg i. B. 1886. 
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36. Auch die Theorie der Beobachtungsfehler, soweit sie 
sich nach dem Vorgange von Gauss in üblicher Weise auf 
Wahrscheinlichkeitsprinzipien stützt, ist in dem angegebenen 
Sinne kritisch beleuchtet worden. Es handelt sich dabei wieder 
darum, festzustellen, inwieweit das Eintreten eines gewissen 
zufälligen Fehlers bei Beobachtungsresultaten der Chance eines 
Zufallsspiels analog zu beurteilen sei. Die Resultate dieser 
Kritik sind für die hier vorliegende Betrachtung von ganz 
besonderer Wichtigkeit, weil die zur Ausgleichung von Be- 
obachtungsresultaten dienende Methode der kleinsten Quadrate 
gewöhnlich deduktiv aus dem Gauss sehen Fehlergesetz ab- 
geleitet zu werden pflegt. Erkennt man nun die notwendigen 
Voraussetzungen der Wahrscheinlichkeitstheorie der Fehler als 
nicht, oder nicht immer, erfüllt, so erhebt sich die Frage, ob 
dann die Methode der kleinsten Quadrate noch immer als 
Prinzip der Ausgleichungsrechnung gelten darf oder man 
wird nach einer anderen, einwurfsfreien Begründung dieser 
Methode suchen müssen. 

Gegen alle Wahrscheinlichkeitsbetrachtung in der Aus- 
gleichungsrechnung erhebt Heger^) den Einwand, „dass es 
sich bei fast allen Fällen der Ausgleichungsrechnung nur um 
^ine verhältnismässig kleine Anzahl von Beobachtungen handelt, 
und dass es bedenklich ist, auf eine Gruppe von wenig Fällen 
Folgerungen aus den für grosse Zahlen geltenden Sätzen an- 
zuwenden." 

Mit grosser Gründlichkeit untersucht von Kries*) auch 
die Voraussetzungen, welche erfüllt sein müssten, wenn die 
Theorie der Zufallsspiele auf diejenige der Beobachtungsfehler 
anwendbar sein sollte. In beiden kommen Erfolge in Frage, 
die von einer grossen Zahl verschiedenartigster Umstände be- 
einflusst werden; trotzdem finden sich erhebliche Unterschiede. 
Die kritische Untersuchung muss hier zunächst die Frage 
erörtern nach der Geltung des Gaussschen Fehlergesetzes. 
Apriorische Wahrscheinlichkeitsansätze müssen immer etwas 
Willkürliches enthalten, weil sie sich auf Voraussetzungen 
gründen, deren Zulässigkeit eigentlich in jedem Falle erst zu 



1) Heger, Ausgleichungsrechnung im Handbuch der Mathematik, 
herausgegeben von Schlömilch IT. Band, Breslau 1881, S. 927. 

2) von Kries, a. a. 0. 
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prüfen wäre. Aus den Untersuchungen von Bessel schliesst 
von Kries, dass die Gausssche Annahme für eine Funktion 
der Wahrscheinlichkeit verschiedener Beträge eines Gesamt- 
fehlers immer dann sehr annähernd gilt, „wenn derselbe durch 
das unabhängige Zusammenwirken sehr vieler elementarer 
Fehler zu stände kommt, ganz ohne Rücksicht darauf, welche 
Wahrscheinlichkeit für die grösseren oder kleineren Beträge 
jedes einzelnen von diesen in Anrechnung zu bringen ist."^) 
Es erscheint nicht ungerechtfertigt, diese Bedingung in vielen 
FäUen als erfüUt anzusehen; in anderen dagegen trifft sie 
ebenso bestimmt nicht zu, sodass nur eine angenäherte aber 
nicht durchgängige Giltigkeit der der mathematischen Be- 
handlung der Fehlertheorie zu Grunde liegenden Annahmen 
behauptet werden kann. Die nur approximative Giltigkeit des 
Gauss sehen Fehlergesetzes ist für die meisten praktisch vor- 
kommenden Fälle ausreichend. Eine ganz allgemeine Methode 
der Verwertung von Beobachtungen, die die wahrscheinlichsten 
Resultate zweifellos liefern würde, kann es der Natur der Sache 
nach gar nicht geben. Da aber für die Kombination vieler 
Beobachtungen eine bestimmte Methodik gefunden werden muss, 
die im Einzelfalle Unsicherheit und Willkür ausschliesst, so er- 
scheint es „hiemach zulässig und indiziert, sich in den meisten 
FäUen mit der Methode der kleinsten Quadrate und ihren 
Ergebnissen befriedigt zu erklären und es dabei bewenden 
zu lassen, schon weil nichts Besseres an ihre Stelle gesetzt 
werden kann". Auf der anderen Seite wird aber die nicht 
selten zu findende Überschätzung derselben und ihrer fundamen- 
talen Annahmen vermieden werden müssen. Auf zwei Punkte 
möchte ieh hier hauptsächlich hinweisen. Erstlich ist es ganz 
verkehrt, das Gausssche Fehlergesetz als ein in irgend welchen 
Fällen absolut und streng giltiges anzusehen. Wenn es auch 
mit Bezug auf die hauptsächlich interessierenden Resultate ein- 
flusslos ist, ob man sehr grosse Fehler als äusserst unwahr- 
scheinlich oder als unmöglich ansieht, so ist doch im Inter- 
esse der Deutlichkeit und Korrektheit der Vorstellungen zu 
fordern, dass hierüber keine falschen Behauptungen in den 
Lehrbüchern sich einbürgern."^) 

1) A. a. 0. S. 227. 

2) A. a. 0. S. 231. 
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Haftet also dem Gauss sehen Felilergesetz wie der darauf 
gegründeten Methode der kleinsten Quadrate unvermeidlich 
etwas Willkürliches und daher Unsicheres an, so warnt von 
Kries nochmals nachdrücklich vor der durchweg üblichen Über- 
schätzung ihrer Resultate. ,,Es ist eine gar zu nahe liegende, 
und durch die verbreitete Meinung über die Bedeutung der 
Wahrscheinlichkeitsrechnung noch besonders begünstigte Vor- 
stellung, dass wenn irgend welche Beobachtungen nach den 
Vorschrifken der Theorie verwertet, ein gewisses Resultat als 
das wahrscheinlichste herausgebracht, und der wahrscheinliche 
Fehler desselben bestimmt worden ist, hiermit nun definitiv 
und ohne jede Widerrede festgestellt sei, wie das betreffende 
Resultat beurteilt und welcher Grad von Sicherheit ihm zu- 
geschrieben werden müsse. Dieser Vorstellung gegenüber kann 
nicht nachdrücklich genug darauf hingewiesen werden, dass 
keine Fehlertheorie und keine Wahrscheinlichkeitsrechnung dies 
leistet, dass vielmehr jede von Voraussetzungen ausgeht, 
welche in jedem besonderen Falle geprüft werden müssen .... 
Dass die allgemeinen Darstellungen der Fehlertheorie diesen 
Punkt nicht genügend berücksichtigen, liegt in dem Irrtum, 
dass die WahrscheinlichkeitsziflFem den jeweiligen Wissenszustand 
stets in erschöpfender Weise zum Ausdruck bringen, tief be- 
gründet. Dagegen ist es mir nicht zweifelhaft, dass die meisten 
Naturforscher, welche mit Anwendungen der Fehlertheorie zu 
thun haben, in diesem Pimkte sich keiner Illusion hinzugeben 
pflegen. Ein Physiker, der von irgend einer neuen Beobachtung 
Kenntnis nimmt, wird, wenn er gegen die Methode irgend 
welche Bedenken hat, sich sehr wenig dadurch imponieren 
lassen, dass der wahrscheinliche Fehler der Resultate sehr 
klein angegeben wird; vielmehr dürfte er immittelbar einsehen, 
dass eine solche Angabe zunächst von durchaus zweifelhaftem 
Werte ist."^) 

Am Schlüsse seines Buches kommt von Kries in der 
Skizzierung einer für den Unterricht geeigneten Darstellung der 
Wahrscheinlichkeitsrechnung auf die Behandlung des Gauss- 
schen Fehlergesetzes und der daraus abgeleiteten Methode der 
kleinsten Quadrate nochmals zurück. „Es würde zu zeigen 
sein, dass man die Annahmen objektiven Inhalts, welche dem 



1) A. a. 0. S. 232 flg. 
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Grau SS sehen Fehlergesetz zu Grunde liegen^ sowohl von nicht 
unwahrscheinlichen Voraussetzungen ausgehend, deduktiv er- 
halten, als auch vielfach empirisch bestätigen kann. Der Inhalt 
desselben würde somit als eine wohlbegründete, doch aber in 
jedem Einzelfalle mit Vorsicht zu prüfende Annahme erscheinen. 
Damit wäre die richtige Schätzung der Ergebnisse, welche die 
Methode der kleinsten Quadrate Üefert, namentlich des wahr- 
scheinlichen Fehlers, von selbst gegeben."^) 

37. So scharf auch von Kries in seinen eingehenden 
Untersuchungen die eigentliche Stellung und wirkliche Trag- 
weite des Gaussschen Fehlergesetzes beleuchtet, so wenig 
wird er, meiner Meinung nach, der logisch -mathematischen 
Bedeutung der Methode der kleinsten Quadrate gerecht. Sie 
erscheint bei ihm als ein rein konventionelles Auskunftsmittel, 
dessen man sich in allen Fällen bedient, selbst dann, wenn 
man nicht sicher ist, dass das Gausssche Fehlergesetz gilt, das 
man sogar wider besseres Wissen dann anwenden muss, wenn 
man sicher ist, dass die Voraussetzungen dieses Gesetzes nicht 
erfüllt sind. Und das kann geschehen, „schon weil nichts 
Besseres an ihre Stelle gesetzt werden kann", wenn man sich 
nur vor einer Überschätzung ihrer Resultate in Beziehung 
auf deren Wahrscheinlichkeit hütet. Da würde sich doch vor 
allem die Frage aufwerfen lassen, warum giebt es nichts 
Besseres? Auf diese Frage möchte ich die Antwort geben: 
weil die Methode der kleinsten Quadrate eine allgemeinere 
Bedeutung hat als ein bloss konventionelles Prinzip zur Aus- 
gleichung von Beobachtungsresultaten zu sein. Ihre Anwendung 
bei dem Problem der Ausgleichungsrechnung ist nur ein spe- 
zieller Fall. Dagegen hat das Gausssche Fehlergesetz etwas 
Konventionelles; da im ganzen nicht viel darauf ankommt, ob 
die Voraussetzungen seiner Giltigkeit immer streng erfüllt 
sind, so nimmt man es als allgemein giltig an, weil nichts 
Besseres an seine Stelle gesetzt werden kann. 

Das konventionell als allgemein giltig angesehene Fehler- 
gesetz nimmt die Wahrscheinlichkeit, einen Fehler von der 
Grösse x zu begehen, als proportional der Funktion 6~**** an, 
worin h das sogenannte Präzisionsmaß bedeutet. Man kann 

1) A. a. 0. S. 297. 

Henke, Methode der kleinsten Quadrate. 2. Aofl. 5 
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diese Funktion entweder durch Deduktion aus völlig willkür- 
lichen Annahmen über die Ursachen^ aus deren Zusammen- 
wirken Fehler von gewisser Grösse entstehen, nach Analogie 
der Zufallsspiele ableiten; oder man kann die Funktionsform 
induktiv als diejenige annehmen, die den notwendigen Voraus- 
setzungen über die Wahrscheinlichkeit eines Fehlers analytisch 
am einfachsten und daher zweckmässigsten entspricht. In dieser 
Beziehung muss die Fimktion die Eigenschaften besitzen: 
1. eine gerade Fimktion zu sein, 2. bei x^O ein Maximum 
zu haben, 3. von o; — an zunächst langsam, bald aber sehr 
rasch abzunehmen, 4, bei einem wenig von verschiedenen 
Werte von x den Wert anzunehmen. Den Forderungen 
1 bis 3 entspricht die Funktion e~*'**'*; es kann überhaupt 
jede gerade Funktion, welche bei a; «- ein Maximum hat, in 
der nächsten Umgebung dieses Wertes durch die Funktion 
(jß—h^x^ ersetzt werden, wenn C und h in geeigneter Weise 
zu bestimmende Konstanten sind^). Die Forderung 4 dagegen 
erfüllt die Funktion nicht, da sie sich asjnmptotisch dem Werte 
nähert, den sie für x^ <x> annimmt. Wenn es nun auch 
praktisch belanglos ist, einem wenn auch noch so grossem 
Fehlerbetrage eine, wenn auch von sehr wenig verschiedene 
Wahrscheinlichkeit zuzuschreiben, so geht doch daraus deutlich 
hervor, dass das konventionelle Fehlergesetz, mag es nun deduk- 
tiv oder induktiv hergeleitet werden, als eine empirische Formel 
zu betrachten ist, die den natürlichen Verhältnissen nur 
näherungsweise entspricht. 

Die Funktion g— **** hat aber noch den Vorteil, dass sie 
gestattet, nach den Gnmdsätzen der Wahrscheinlichkeits- 
rechnung das Prinzip der Ausgleichungsrechnung, die Methode 
der kleinsten Quadrate, zu deduzieren. Würde es möglich sein, 
die konventionelle Funktionsform durch eine Korrektur besser 
mit der Forderung 4 in Einklang zu bringen, oder würde man 
sogar eine ganz andere Funktionsform konstruieren können, 
welche allen Forderungen genauer gerecht wird, so ginge 
dieser Vorteil offenbar verloren. Wollte man dann die Methode 
der kleinsten Quadrate, weil man nichts Besseres an ihre Stelle 
setzen kann, dennoch zur Ausgleichung von Beobachtungs- 

1) Vergl. Czuber, Theorie der Beobachtungsfehler, Leipzig 1891; 
S. 301 Anm. 
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resultaten anwenden, so könnte nicht mehr behauptet werden, 
dass man dadurch die wahrscheinlichsten Werte der Un- 
bekannten erhielte. Will man sich aber auch in allen Fällen 
mit der konventionellen Funktion zufrieden geben, so erscheint 
es mir logisch bedenkUch, aus einer empirischen Formel durch 
Deduktion den Fundamentalsatz der mit unbestreitbarer Giltig- 
keit in allen Fällen anzunehmenden Methode der kleinsten 
Quadrate ableiten zu wollen. 

38. Nach diesen Betrachtungen würde ich es für zweck- 
mässig halten, wenn man zur Begründüng der Methode der 
kleinsten Quadrate die Wahrscheinlichkeitstheorie überhaupt 
nicht mehr in Ansprach nehmen würde. Das Problem der 
Ausgleichungsrechnung ist eine Aufgabe des „möglichst nahe 
Liegens^' und kann gelost werden durch das Prinzip, dass 
die Quadratsumme der Abweichungeh ein Minimum werde. ^) 
Die Willkür in der Annahme dieses Prinzips tritt klar und 
unverhüUt hervor, aber man sieht dafür auch deutlich, dass 
und warum man nichts Einfacheres an seine Stelle setzen kann. 

Bei dieser Begründung der Methode der kleinsten Quadrat^ 
bleibt noch immer die Möglichkeit, in üblicher Weise die 
Genauigkeit von Beobachtungen und den Grad der Zuverlässig- 
keit der durch die Ausgleichung gewonnenen Resultate zu 
schätzen. Die Definition des durchschnittlichen und des 
mittleren Fehlers, die als Genauigkeitsmaß ge^vählt werden 
können, sind von Wahrscheinlichkeitsbetrachtungen unabhängig. 
Nur die Definition des wahrscheinlichen Fehlers beruht 
auf dem Feblergesetz. Er ist aber wohl als entbehrlich 
anzusehen, da Gauss selbst in einem Briefe an Schumacher^) 
sagt: „Die sogenannten wahrscheinlichen Fehler wünsche ich 
eigentlich, als von Hypothese abhängig, ganz proskribiert; man 
mag sie berechnen, indem man die mittleren mit 0,6744897 
multipliziert.^^ Verzichtet man also auf die Bestimmung des 
wahrscheinlichen Fehlers, so hat man in dem mittleren Fehler 
ein passendes Genauigkeitsmaß für die Resultate der Aus- 



1) Vergl. Abschnitt lÜ der vorliegenden Schrift. 

2) Vergl. Jordan, Handbuch der Vermessungskunde, I. Band 
Ausgleichungsrechnung nach der Methode der kleinsten Quadrate 3. Aufl. 
Stuttgart 1888, S. 274. 

5* 
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gleichungsrechnuDg auch nach einer allgemeioeren Begründung 
der Methode der kleinsten Quadrate. Denn da diese verlangt, 
die Summe der Quadrate der Abweichungen zu einem Minimum 
zu machen, so wird der für das Minimum dieser Quadrat- 
summe sich ergebende Wert das einfachste Maß für die er- 
haltene Annäherung darbieten. Es ist wohl auch die Angabe 
des mittleren Fehlers, wenigstens bei den Geodäten, die allein 
übliche. 

Sehr wichtig wäre für die Praxis die Peststellung des 
Betrages eines in jedem Falle grössten zulässigen Fehlers; 
d. h. die Bestimmung der Grenze, über welche hinaus ein 
Fehler nicht mehr als unvermeidlich und darum zulässig, 
sondern als „grober" Fehler zu bezeichnen ist. Hierüber hat 
aber die Wahrscheinlichkeitstheorie der Fehler bis jetzt noch 
keinen Aufschluss zu geben vermocht. Das Gausssche Fehler- 
gesetz giebt für keinen endlichen Wert eines Fehlers die 
Wahrscheinlichkeit Null. Die etwaigen Festsetzungen eines 
Maximalfehlers als ein gewisses Vielfaches des mittleren Fehlers 
sind nur auf Grund willkürlicher Annahmen möglich. Nach 
Jordan^) berührt die Frage nach dem Maximalfehler einer 
Beobachtungsart „eine wunde Stelle der Fehlertheorie. Es 
ist zweifellos, dass für jede Art von Beobachtungen eine ge- 
wisse Grenze besteht, deren Überschreitung nur beim Vor- 
handensein eines groben Fehlers denkbar ist, z. B. die Wahr- 
scheinlichkeit, bei der Winkelmessung mit einem guten Theodolit 
einen Fehler von 1^ zu begehen, ist ohne alle Frage -= Null, 
und nicht ein Wert, der von der Null verschieden ist. 

Die Ausgleichungsrechnung hat kein Bedürfnis, einen 
Grenzfehler festzustellen, dagegen tritt bei amtlichen Fehler- 
bestimmungen, in Vermessungs - Anweisungen, im Aichungs- 
wesen u. s. w., dieses Bedürfnis sehr dringlich auf." 

Die wahrscheinlichkeitstheoretischen Untersuchungen auf 
Grund des Fehlergesetzes sind also mindestens nicht notwendig 
zur Begründung der Methode der kleinsten Quadrate. Sie 
leisten auch, abgesehen von der Angabe des wahrscheinlichen 
Fehlers, keine besonderen Dienste für die Beurteilung der 
Genauigkeit von Beobachtungsresultaten und zur Feststellung 
des zulässigen Maximalfehlers. 



1) Jordan a. a. 0., S. 294 flg. 
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Wenn man sich damit begnügen wollte, die Methode der 
kleinsten Quadrate als das Prinzip zur Lösung der Aufgabe 
des möglichst nahe Liegens zu begründen, so wäre es schliess- 
lich gleichgiltig und nur in dem Wortausdruck verschieden, ob 
man die durch die Ausgleichungsrechnung erhaltenen Resultate 
als die wahrscheinlichsten oder nur als Mittelwerte oder 
Durchschnitts-, plausibelste u. s. w. Werte bezeichnen 
wollte. So hat man auch bei dem Ton altersher unbestritten an- 
gewendeten Prinzip des arithmetischen Mittels zunächst nicht 
daran gedacht, einen wahrscheinlichsten, sondern, wie der 
Name eben sagt, einen Mittelwert zu erhalten. Es steht frei, 
ihn auch als den subjektiv wahrscheinlichsten Wert zu 
betrachten, wenn man ihn aber zum Ausgangspunkt wahr- 
scheinlichkeitstheoretischer Folgerungen nimmt, so macht man 
eine ebenso willkürliche Annahme, wie wenn man ihn als 
denjenigen Wert bezeichnet, der den Einzelwerten „möglichst 
nahe liegt." 



V. 



Weitere litterarische Bemerkungen über Begründung 
und Bedeutung der Methode der kleinsten 

Quadrate. 



39. Die ausserordentliche ReicKhaltigkeit der Litteratur 
über die Methode der kleinsten Quadrate zeugt von dem un- 
verminderten Interesse, das die bedeutendsten Geometer, Physiker, 
Geodäten und Astronomen immer von neuem an diesem Gegen- 
stand nehmen. Schon 1877 zählt Merriman^) 408 Titel von 
Schriften über denselben auf. Man betrachtet wohl jetzt all- 
gemein die Methode der kleinsten Quadrate als ein unentbehr- 
liches Hilfsmittel zur Ausgleichung von Beobachtungsresultaten. 
Dabei wird es denjenigen, die sich der Methode praktisch be- 
dienen, begreiflicherweise weniger ankommen auf eine Ver- 
tiefung in Untersuchungen über eine möglichst vorurteilslose 
Begründung derselben, als auf eine immer schärfere Beurteil- 
ung ihrer Resultate hinsichtlich der Genauigkeit und Zu- 
verlässigkeit. Diese fehlertheoretischen Untersuchungen, die 
sich meist auf das Gausssche Fehlergesetz gründen oder 
wenigstens darauf zurückkommen, verfahren ausnahmslos nach 
den Prinzipien der Wahrscheinlichkeitsrechnung. Mit grösstem 
Scharfsinn und zum Teil mit Anwendung eines umfangreichen 
Rechenapparats werden in den bedeutenden Arbeiten von 
Andrae, Bertrand, Helmert, Jordan u.a. Fragen erörtert, 
die ebensosehr von theoretischem Interesse, wie von praktischer 
Wichtigkeit sind. Diese Arbeiten ihrer Bedeutung nach ein- 
gehend zu würdigen, fällt nicht in den Rahmen dieser Schrift. 

1) Merriman, List of Writings relating to the Method of Least 
Squares. Connecticut. Transact. IV. vergl. Czuber, Theorie der Be- 
obachtungsfehler, Leipzig 1891, im Vorwort. 
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Czuber^) ist es gelungen^ „ein möglichst umfassendes und 
znsam m enh angendes Bild der wissenschaftlichen Grundlagen 
der Pehlertheorie und ihrer Entwickelung zu geben.'^ 

Dagegen enthalten . die meisten Lehrbücher der Aus- 
gleichungsrechnung, die für den praktischen Gebrauch bestimmt 
sind, in Beziehung auf die B^ründung der Methode der 
kleinsten Quadrate nichts prinzipiell Neues. Wenn sie über- 
haupt eiue Begründung derselben geben, so pflegt am häufigsten 
eine von Gauss, zuweilen auch die von Hagen und Bessel 
reproduziert zu werden. 

In durchaus eigenartiger Weise verfahrt eins der auerkännt 
gediegensten Lehrbücher dieser Art, das von Helmert*). Aus 
den notwendig zu erfallenden Bedingungen für die Wahrschein- 
lichkeit, einen Fehler von der Grösse e zu begehen, wird die 
Möglichkeit von 3 Formen des Fehlergesetzes abgeleitet: 

I) 9,(5) «c, 

ni) ^(,) = ,,-....>^ 

worin c, a, h gewisse Konstanten bedeuten. Die Form III 
entspricht erfahrungsmässig dem Vorkommen zufälliger 
Beobachtungsfehler mit grosser Annäherung. Für den plau- 
sibelsten Wert einer Unbekannten, die durch mehrmalige 
gleichgenaue Messungen bestimmt ist, wird einfach, dem prak- 
tischen Gefühl folgend^ das arithmetische Mittel der Beobach- 
tungswerte zu nehmen sein. Betrachtet man dasselbe zugleich 
als den wahrscheinlichsten Wert der Unbekannten, so er- 
giebt sich daraus die Form III des Fehlergesetzes und dann 
folgt, dass das arithmetische Mittel die kleinste Summe für 
die Quadrate derYerbesserungen giebt. Dasselbe Ausglei^jhungs- 
verfahren, die Quadratsumme der Verbessenmg en zu einem Mini- 
mum zu machen, kann liun auch ohne Rücksicht auf eine be- 
stimmte Form des Pehlergesetzes bei vermittelnden Beobacht- 
ungen gleicher Genauigkeit angewendet werden, um auch hier die 
plausibelsten Werte der Unbekannten zu erhalten. Stellt sich 
nun nach erfolgter Ausgleichung herauf, dass für einen Fall das 

1) Czuber a. a. 0. 

2) Helmert, die Ausgleichungsrechnung nach der Methode der 
kleinsten Quadrate. Leipzig 1872. 
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Fehlergesetz in der Form III gilt, so hat man durch dieses Aus- 
gleichungsverfahren zugleich die wahrscheinlichsten Werte 
der Unbekannten und damit die kleinsten mittleren Fehler. Gilt 
diese Form des Fehlergesetzes nicht, so hat man nicht mehr 
die wahrscheinlichsten Werte, wohl aber noch die kleinsten 
mittleren Fehler, solange nur die Bedingung erfüllt ist, dass 
Fehler von gleichem absolutem Wert, aber entgegengesetzten 
Vorzeichen, gleich häufig auftreten. Ist auch diese Bedingung 
nicht erfüllt, so giebt die Ausgleichung nach der Methode 
der kleinsten Quadrate weder wahrscheinlichste Werte, noch 
kleinste mittlere Fehler. „Sie hat alsdann nur die Bedeutung 
eines einfachen und stets auf praktisch durchführbare Rech- 
nungen führenden Verfahrens, um die Beobachtungen durch 
kleine Verbesserung in Einklang zu bringen: die Funktion 
ax + by + C0.., für die gegebenen Systeme der Veränderlichen 
a^feiCi, Ogfeg^-«« den beobachteten Funktionswerten möglichst 
eng anzuschliessen."^) Da hier ausdrücklich eine Bedeutung 
der Resultate, welche die Methode der kleinsten Quadrate 
liefert, auch in dem Falle anerkannt wird, dass dieselbe nicht 
mehr aus dem Gaussschen Fehlergesetze deduziert werden 
kann, . so wäre nur noch ein kleiner Schritt zu einer all- 
gemeinen Auffassung dieser Methode zu thun. Denn auch 
in den Fällen, in denen die Geltung dieses Fehlergesetzes 
verbürgt ist, hat man ganz dasselbe Interesse, ein Aus- 
gleichungsverfahren einzuschlagen, das stets auf praktisch 
durchführbare Rechnungen führt und eine gegebene Funktion 
den Beobachtungswerten „möglichst eng" anzuschliessen 
erlaubt. 

Das mehr für die praktische Einführung in den Rechen- 
apparat des Ausgleichungsverfahrens bestimmte Lehrbuch von 
Koppe^) begründet in der Einleitung das Gauss sehe Fehler- 
gesetz nach der Methode der Elementarfehler, an Bessel und 
Hagen anschliessend als allgemein giltig, und leitet daraus 
die Methode der kleinsten Quadrate nach den Sätzen der 
Wahrscheinlichkeitsrechnung her. Weiter werden aber eigent- 
lich wahrscheinlichkeitstheoretische Untersuchungen nicht mehr 



1) A. a. 0. S. 93. 

2) Koppe, Die Ausgleichungsrechnung nach der Methode der klein- 
sten Quadrate. Nordhausen 1885. 
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vorgenommen. Wäre also am Anfang des Buches eine all- 
gemeinere Begründung der Methode der kleinsten Quadrate 
gegeben worden, so könnte der übrige Inhalt des Buches un- 
verändert derselbe bleiben, wenn man nur die Begriffe 
„wahrscheinlicliste Werte ^^, „wahrscheinlichste Verbesserungen" 
durch allgemeinere ersetzte. 

Das Lehrbuch von Vogler^) benutzt nur elementar^ 
mathematische Hilfsmittel. Eine Begründung der Methode 
der kleinsten Quadrate wird nicht gegeben. Sie wird aus 
Zweckmässigkeitsgründen angenommen, hauptsächlich deshalb, 
weil die Wahl des arithmetischen Mittels zwischen den Resul- 
taten direkter Messung derselben Grösse, in ihr als spezieller 
Fall enthalten ist. Begriffe und Sätze der Wahrscheinlichkeits- 
theorie kommen in diesem Lehrbuche überhaupt nicht zur 
Anwendung. 

40. Für den Zweck und die Tendenz der vorliegenden 
Schrift musste es von besonderem Interesse sein, dass in einigen 
Werken über die Ausgleichungsrechnung die von dem Verfasser 
angeregte Begründung der Methode der kleinsten Quadrate 
als Prinzip zur Lösung der Probleme des „möglichst nahe 
Liegens" adoptiert worden ist. 

Jordan^ stellt als Aufgabe der Ausgleichungsrechnung 
hin, „aus Beobachtungen, welche in einer das unmittelbare Be- 
dürfnis überschreitenden Anzahl vorhanden sind, und deswegen 
infolge der unvermeidlichen ihnen anhaftenden Beobachtungs- 
fehler auf Widersprüche führen, diejenigen Resultate zu ziehen, 
welche die grösste Wahrscheinlichkeit für sich haben (oder die 
geringsten Fehler fürchten lassen); femer diejenigen Beträge 
anzugeben, um welche mutmasslich die gefundeneu Resultate 
von der Wahrheit noch abweichen." Obwohl hier die „grösste 
Wahrscheinlichkeit" der Resultate gefordert wird, enthält die 
erste Begründung der Methode der kleinsten Quadrate^) keine 
Anwendung von Wahrscheinlichkeitsprinzipien. Sind für die 
u Unbekannten rr, y, j^, . . . die w> w Gleichungen 

1) Vogler, Grundzüge der Ausgleichungsrechnung. Braun- 
Bchweig 1883. 

2) Jordan, Handbuch der Vermessungskunde, I.Band. 

3) Jordan a. a. 0. S. 32flg. 
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1) = QiX + hy + CiZ +•.. + ?.-,* = 1, 2, 3, ... n 

gegeben, worin die l durch Beobachtungen gefunden sind, so 
ergeben sich die Fehlergleichungen 

Vi ^ aiX + biff + CiZ H + ?», i — 1, 2, 3, ... n, 

worin die v die „Widersprüche'^ darstellen. Diese n Wider- 
sprüche können nicht sämtlich verschwinden, sondern man 
muss sich mit einem System x^y^z^,,, begnügen, für welches 
die V im allgemeinen nicht gleich Null werden. 

„Die Aufgabe, ein solches System zu finden, ist ohne 
weitere Bedingung eine unbestimmte; eine solche weitere Be- 
dingung ist insofern, vorhanden, als die Widersprüche v in 
ihrer Gesamtheit möglichst klein sein sollen, so dass den 
Gleichungen (1) möglichst wenig Zwang angethan wird. 

Die allseitig befriedigende mathematische Formulierung 
dieser Bedingung des möglichst Anpassens, oder des kleinsten 
Zwangs lautet: 

' '. Es soll die Quadrat-Summe der Widersprüche v mög- 
lichsh klein sein, ..."^) 

Brfet nach Erörterung der praktischen Anwendung der 
Methode', der kleinsten Quadrate zur Ausgleichung von Bie^ 
obachtungen und zur Bestimmung des mittleren Fehlers kommt 
Jordan aa einer späteren Stelle seines Werkes^) zu ihrer 
Begründung durch die Währöcheinlichkeitsfunktion für die 
Fehler. Die beiden Begründungsweisen werden in ihrör Be- 
ziehung zu einander durch die Worte charakterisiert: 

„Wenn man Weiss, dass die Fehler dem Gaussscheti 
!Pehlergesetz folgen, so hat man die durch die Methode d^r 
kleinsten Quadrate gelieferten Ausgleichungsresültate ala wajir- 
scheinlichste im strengen Sinn zu betrachten. Wenn die 
Giltigkeit dieses Gesetzes nicht verbürgt ist, so . haben die 
Ausgleichijngsresultate nur den Charakter zweckmässigster oder 
plausibelster Annahmen für die unbekannten Grössen."^) 

Gunz auf dem Standpunkt der vorliegenden Schrift steht 
Heger.*) Hat man eine Grösse direkt wiederholt gemesse^ 

1) A. a. 0. S. 33. 

2) A. a. 0. S. 281. 

3) A. a. 0. S. 281. 

4) Heger, s. o. S. 62, Note 1. 



V.Weitere litterarisclie Bemerkungen über Begründung etc. 75 

oder zur Bestimmung von Unbekannten mehr Gleichungen 
durch Messungen erhalten^ als zur Bestimmung der Unbekannten 
nötig sind, so kommt es ,,nun darauf an, für die Un- 
bekannten solche Werte zu ermitteln, die denMessungs- 
resultaten sich möglichst gut anschliessen.^^) Die 
Berechnung dieser Werte ist die Aufgabe der Ausgleichungs- 
rechnung. Sie ist von derselben Art wie die Aufgabe, das 
arithmetische Mittel mehrerer Zahlen zu bestimmen, oder eine 
Gerade, eine Ebene, eine Kurve von gegebener Gleichung zu 
finden, die gegebenen Punkten möglichst nahe liegen. Zur 
Lösung dieser Aufgaben dient dasselbe Prinzip, die Summe 
der Quadrate der Abweichungen zu einem Minimum zu machen, 
das namentlich auch durch die Forderung begründet wird, dass 
sich die Bestimmungsgleichungen für die Unbekannten linear 
ergeben müssen. Als Maß für die Abschätzung der Über- 
einstimmung der Beobachtungsresultate unter einander dient 
die mittlere Abweichung, d. i. die Zahl, der^n Quadrat 
da^ arithmetische Mittel der Quadrate der einzelnen Ab- 
weichungen ist. 

41. In der vorliegenden Schrift^) wurde auch die Möglich- 
keit einer allgemeineren Auffassung der Methode der kleinsten 
Quadrate angedeutet» Dieser Gedanke ist ebenfalls einer ge- 
wissen Beachtung gewürdigt worden. Petzoldt^) interessiert 
an der Methode der kleinsten Quadrate, die durch Analogie 
an das Gauss sehe Prinzip des kleinsten Zwanges erinnert, 
hauptsächlich der Versuch, ihr eine weit über ihren ursprüng- 
lichen Zweck hinausgehende Bedeutung beizulegen. Der Tendenz 
seiner Abhandlung gemäss, sucht er die Hauptbedeutung des 
Prinzips, das zur Auflösung der Aufgaben des möglichst nahe 
liiegens angewendet wird, weniger darin, dass es die Bestim- 
mung eines Minimums verlangt, als in der Eindeutigkeit der 
Resultate. Wie für mehrere Punkte als „Mittelpunkt" ein 
singulärer Punkt sich bestimmen lässt derart, dass zu jedem 
benachbarten Punkte, wenn man ihn als Mittelpunkt ansehen 

1) Heger a. ä. 0. S, 908. 
"'' 2) Vergl. 0. § 25, S. 44 flg. 

3) Petzoldt, Maxima, Minima und Ökonomie. Sonderabdruck 
aus der Vierteljahrsschrifb für wissenschaftliche Philosophie. Alten- 
burg 1891. 
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wollte, mindestens noch ein anderer von derselben „Berechtig- 
ung" gefunden werden könnte; so muss sich analog auch für 
ein System Ton Gleichungen, wenn sie in grösserer Zahl vor- 
handen sind als die daraus zu bestimmenden Unbekannten, 
immer ein singuläres Wertsystem der Unbekannten finden lassen so, 
dass für jedes denkbare benachbarte System mindestens noch ein 
„gleichberechtigtes" vorhanden wäre. Dieses nach der Methode 
der kleinsten Quadrate berechnete System muss auch die Be- 
dingung des „möglichst nahe Liegens" erfüllen, aber es ist das 
grössere Gewicht auf die Singularität dieses Systems, und also 
auf die darausfolgende Eindeutigkeit der Werte, die es giebt, 
zu legen. „Denn nehmen wir an, dass Eindeutigkeit niemals 
mit einer ^möglichst genauen Erfüllung' der Gleichungen ver- 
bunden wäre, dass vielmehr immer eine Reihe von Wert- 
systemen der Unbekannten in völlig gleichberechtigter Weise 
der Forderung des möglichst Nahekommens Genüge leistete, 
so würde man eben das wenn auch femer gelegene, so doch 
eindejitig bestimmte Wertsystem als Repräsentanten der das- 
selbe bedingenden Gruppe von Einzelwerten zu betrachten 
haben. Für eine Wahl unter mehreren gleichberechtigten 
Systemen wäre keine Direktive vorhanden, während Eindeutig- 
keit alle Wahl überflüssig macht, also regellose Willkür aus- 
schliesst. Es kann somit keinem Zweifel unterliegen, dass man 
in dem gedachten irrealen Falle auf das 'möglichst genaue 
Genügen' zu Gunsten der eindeutigen Bestimmtheit zu ver- 
zichten hätte. Für die Vergleichung der aus den Einzelbeob- 
achtungen durch die entsprechende Ausgleichsrechnung ge- 
wonnenen Resultate wäre das auch völlig gleichgiltig, da die 
letzteren ja alle nach derselben Methode gefunden wären 
und somit für die zu abstrahierenden Gesetze eine nicht minder 
exakte Grundlage als unsere that sächlichen, mit den beobach- 
teten 'möglichst genau' übereinstimmenden Werte böten." ^) 

Es ist ohne weiteres zuzugeben, dass zur Wahl der 
Summe der Quadrate, die zu einem Minimum gemacht 
werden soll, ganz wesentlich die Forderung hingeleitet hat, 
dass die Resultate der Ausgleichungsrechnung eindeutig be- 
stimmt sein, also aus linearen Gleichungen sich ergeben 
müssen. Die Methode der kleinsten Quadrate giebt lineare 



1) A. a. S. 14. 
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